Automatisierte Zuordnung von ICD- und Alpha-ID-Codes zu „Real-World“-Arztbriefdiagnosen durch die „word2vec“-Methode
Für eine wissenschaftliche auswertung von Arztbriefen bedarf es aufgrund unterschiedlicher Terminologien und dem häufigen Gebrauch von Synonymen der Transformation in ein normiertes Codesystem wie bspw. icd-10 oder alpha-id. Das sog. „Word Vector Embedding“ erscheint für die Generierung des dafür erforderlichen Thesaurus geeignet, da hierüber – nach geeignetem Training des zugrunde liegenden neuronalen Netzwerkes – synonyme diagnosen unabhängig von der Schreibweise automatisch identifiziert werden können. […]
Aus „Real-World“-Arztbriefen und der offiziellen Alpha-ID-Datei und lässt sich mit der „word2vec“-Methode ein Diagnosenthesaurus generieren. Dieser könnte, eine geringfügige manuelle Überarbeitung vorausgesetzt, zukünftig für eine automatische Extraktion von Diagnosen aus Arztbriefen verwendet werden.
Quelle: thieme-connect.com