Name	Name	Last commit message	Last commit date
parent directory ..
src	src
.gitignore	.gitignore
Dockerfile	Dockerfile
README.md	README.md
docker-compose.yml	docker-compose.yml
pom.xml	pom.xml
run.sh	run.sh

Name

Last commit message

Last commit date

Named Entity Extraction

A legal document processing system receives contracts in plain text. Each document needs tokenization, named-entity recognition (people, organizations, dates, monetary amounts), and structured extraction into a JSON schema that downstream contract-management software can ingest.

Pipeline

[ner_tokenize]
     |
     v
[ner_tag]
     |
     v
[ner_extract_entities]
     |
     v
[ner_link]

Workflow inputs: text

Workers

ExtractEntitiesWorker (task: ner_extract_entities)

Writes entities, entityCount

LinkWorker (task: ner_link)

Uses randomization
Writes linkedEntities

TagWorker (task: ner_tag)

Filters with predicates
Writes taggedTokens

TokenizeWorker (task: ner_tokenize)

Writes tokens, tokenCount

8 tests | Workflow: ner_named_entity_extraction | Timeout: 60s

See RUNNING.md for setup and usage.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

Named Entity Extraction

Pipeline

Workers

FilesExpand file tree

named-entity-extraction

Directory actions

More options

Directory actions

More options

Latest commit

History

named-entity-extraction

Folders and files

parent directory

README.md

Named Entity Extraction

Pipeline

Workers