Nosso objetivo era treinar um algoritmo de processamento de linguagem natural (NLP) para capturar as características de imagem dos nódulos pulmonares relatados em um relatório de TC estruturado e sugerir a categoria Lung-RADS ™ (LR) aplicável.
Nosso estudo incluiu relatórios clínicos estruturados de exames consecutivos de triagem de pulmão de TC (CTLS) realizados de 08/2014 a 08/2015 em um Centro de triagem de câncer de pulmão acreditado por ACR. Todos os pacientes selecionados estavam em alto risco de câncer de pulmão de acordo com as Diretrizes NCCN ® . Todos os exames foram interpretados por um dos três radiologistas credenciados para ler exames CTLS usando LR usando um modelo de relatório padrão. Conjuntos de treinamento e teste consistiram em exames consecutivos. Os exames de triagem pulmonar foram divididos em dois grupos: três conjuntos de treinamento (500, 120 e 383 relatórios cada) e um conjunto de avaliação final (498 relatórios). Os resultados do algoritmo de PNL foram comparados com o padrão-ouro da categoria LR atribuído pelo radiologista.
A sensibilidade / especificidade do algoritmo NLP para atribuir corretamente categorias LR para nódulos suspeitos (LR 4) e nódulos positivos (LR 3/4) foram 74,1% / 98,6% e 75,0% / 98,8%, respectivamente. A maioria dos desajustes ocorreu nos casos em que os achados pulmonares estavam presentes atualmente não abordados por LR. As classificações erradas também resultaram da falha na identificação de exames como acompanhamento e na falta de caracterização completa de nódulos parte sólidos. Em uma análise de subgrupos entre relatórios estruturados com linguagem padronizada, a sensibilidade e especificidade para detectar nódulos LR 4 foram de 87,0% e 99,5%, respectivamente.
Um sistema NLP pode sugerir com precisão a categoria LR apropriada dos achados do exame CTLS quando o relatório padronizado é usado.