Named Entity Recognition (NER)

In het bedrijfsleven of bij de overheid hebben administraties enorme hoeveelheden documenten die ze moeten verwerken of beheren.

Deze documenten moeten vaak geindexeerd en georganiseerd worden, zodat informatie zo vlot mogelijk terug te vinden is. In deze context is NER een techniek gebaseerd op machine learning en Natural Language Processing (NLP), een bijzonder interessante oplossing. Deze laat automatisch informatie ophalen uit documenten.

NER kan zogenaamde ‘named entities’ herkennen in documenten. Named entities kunnen standaard NAW gegevens zijn zoals

  • naam
  • plaats
  • adres
  • datum
  • email adres

Maar het kunnen ook labels zijn voor uw bedrijfstak specifiek:

  • Een HR afdeling die alleen de skillset wil filteren uit een stapel CV’s.
  • Een overheidsinstantie die een document wil vrijgeven maar eerst persoonlijke gegevens wil verwijderen (anoniemiseren).
  • Administratie afdeling die geldbedragen of IBAN-codes wil filteren

Labels voor uw onderneming specifiek word getrained met uw eigen gelabelde data.

Hieronder in de screenshot kan je zien hoe named entity recognition er uit ziet.

Contact