Atualmente, a prática de registar informações clínicas em “texto livre” oferece flexibilidade, mas dificulta a extração automática de dados, limitando a aplicação de modelos analíticos. A maior parte dos registos é não estruturada, e o uso de abreviaturas não padronizadas aumenta a ambiguidade, dificultando a interpretação. A revisão manual é lenta e sujeita a erros, enquanto os sistemas de apoio à decisão clínica, que dependem de dados estruturados, são ineficazes para “texto livre”. O uso de text mining e processamento de linguagem natural na saúde ainda está numa fase inicial, sem uma aplicação generalizada em contextos clínicos.

Início / Publicações / Publicação

Início / Publicações / Publicação

Médico analisando dados médicos no computador

Tipo de publicação: Resumo do Artigo
Título original: Validação de algoritmos de text mining em contexto de oncologia
Data de publicação do artigo: Outubro de 2020
Fonte: Repositório Aberto da Universidade do Porto
Autor: Renato Ferreira Magalhães
Orientadores: Mário Amorim Lopes & Lúcio Lara Santos

Qual é o objetivo, público-alvo e áreas da saúde digital em que se enquadra?
     Este estudo tem como objetivo fornecer informação clínica estruturada para apoiar a tomada de decisões, facilitando a consulta de dados clínicos, de forma a auxiliar os profissionais de saúde nas suas atividades diárias. A principal área de saúde digital abrangida é a Inteligência Artificial (IA), com ênfase em machine learning.

Qual é o contexto?
     Este estudo foi realizado num hospital oncológico de referência que gera grandes volumes de dados clínicos provenientes de atos médicos, diagnósticos, tratamentos e resultados de exames. O processo de consultar e registar corretamente os dados de cada paciente é demorado, o que prolonga as consultas e reduz o tempo dos profissionais de saúde, consequentemente impactando a qualidade das decisões clínicas. A pandemia COVID-19, período em que o estudo foi conduzido, agravou ainda mais estas dificuldades, complicando a alocação de profissionais para as tarefas de anotação dos dados.

Quais são as abordagens atuais?
     Atualmente, a prática de registar informações clínicas em “texto livre” oferece flexibilidade, mas dificulta a extração automática de dados, limitando a aplicação de modelos analíticos. A maior parte dos registos é não estruturada, e o uso de abreviaturas não padronizadas aumenta a ambiguidade, dificultando a interpretação. A revisão manual é lenta e sujeita a erros, enquanto os sistemas de apoio à decisão clínica, que dependem de dados estruturados, são ineficazes para “texto livre”. O uso de text mining e processamento de linguagem natural na saúde ainda está numa fase inicial, sem uma aplicação generalizada em contextos clínicos.

Em que consiste a inovação? Como é que é avaliado o impacto deste estudo?
     A inovação deste estudo consiste na criação de um repositório de dados estruturados que alimenta os sistemas de apoio à decisão clínica. Este repositório é construído a partir da transformação dos registos dos pacientes (diários clínicos) escritos em “texto livre” em dados estruturados, através de text mining e processamento de linguagem natural.

     O processo começa com a extração de texto a partir dos documentos PDF, seguida da normalização, que inclui a correção das frases e a substituição de abreviaturas pelos seus termos completos. Com o texto já normalizado, procede-se à identificação das 3 categorias ou entidades a que os dados se referem: ‘Procedimentos’, ‘Doenças’ ou ‘Medicamentos’ através de algoritmos de text mining. O processamento de linguagem natural é utilizado para a análise e compreensão dos textos.

     Neste estudo foram utilizados 2 processos clínicos e aplicados 2 modelos de treino dos algoritmos. No modelo semi-supervisionado, o treino foi realizado associando automaticamente o vocabulário biomédico do UMLS (Sistema Unificado de Linguagem Médica) às 3 categorias enquanto no modelo supervisionado, o treino foi realizado através da identificação manual das categorias por 2 anotadores humanos (A e B). O estudo também incluiu a validação clínica dos algoritmos de text mining no contexto oncológico, assegurando a relevância prática e a aplicabilidade dos modelos desenvolvidos. O impacto dos modelos foi avaliado através de métricas de desempenho como precisão além de uma análise qualitativa realizada por um médico sénior. 

Quais são os principais resultados? Qual é o impacto destes resultados? Qual é o futuro desta tecnologia?
     O modelo semi-supervisionado apresentou um resultado de precisão de 86,6%, enquanto o modelo supervisionado obteve 63,8% de precisão com o anotador A e 65,7% com o anotador B. A análise qualitativa revelou que ambos os modelos deixaram algumas categorias/entidades por identificar em determinadas frases. Embora os resultados sejam promissores, há necessidade de reforçar a formação dos anotadores e treinar os algoritmos com mais dados validados.

     O impacto destes resultados é significativo, pois demonstra que é possível criar ferramentas de apoio à decisão clínica. A utilização de dados estruturados permitirá a criação de dashboards intuitivos que apresentem informações críticas, como diagnósticos, medicação, e até uma linha temporal detalhada com o histórico clínico do paciente. Esta organização oferecerá uma visão clara e rápida das condições do doente, auxiliando os profissionais de saúde na tomada de decisões mais informadas e diminuindo o tempo de análise de grandes volumes de “texto livre”.

     No futuro, esta ferramenta pode ser ampliada para integrar IA, ajudando a comparar tratamentos e prever resultados com base em dados de pacientes semelhantes, cruzando informações com normas internacionais e evidências científicas. Com isso, a ferramenta proporcionará uma maior personalização dos tratamentos e otimização de recursos. Ao reduzir redundâncias, como a repetição de exames, e melhorar a eficiência dos processos clínicos, a tecnologia poderá impactar diretamente a qualidade dos cuidados de saúde e reduzir os custos.

TEF-HEALTH Logo

SPMS integra a iniciativa TEF-Health

A SPMS participa na iniciativa TEF-Health como parceira de um consórcio composto por 51 entidades de 9 países da União Europeia. Esta ação é cofinanciada…

Ler mais

tem uma ideia inovadora
na área da saúde?

Partilhe-a connosco e veja-a ganhar vida.
Ajudamos a dar vida aos seus projetos!

Newsletter

Receba as novidades do
Portal InovarSaúde

República Portuguesa logo
logotipo SNS
SPMS logotipo

Acompanhe-nos

Cofinanciado por :

PRR Logotipo
república Portuguesa logo
União Europeia Logo

Newsletter

Receba as novidades do
Portal InovarSaúde

República Portuguesa logo
SNS Logo
SPMS Logo

Acompanhe-nos

Cofinanciado por :

PRR Logotipo
República Portuguesa logo
União Europeia Logo

Início / Publicações / Publicação

Médico analisando dados médicos no computador

Tipo de publicação: Resumo do Artigo
Título original: Validação de algoritmos de text mining em contexto de oncologia
Data de publicação do artigo: Outubro de 2020
Fonte: Repositório Aberto da Universidade do Porto
Autor: Renato Ferreira Magalhães
Orientadores: Mário Amorim Lopes & Lúcio Lara Santos

Qual é o objetivo, público-alvo e áreas da saúde digital em que se enquadra?
     Este estudo tem como objetivo fornecer informação clínica estruturada para apoiar a tomada de decisões, facilitando a consulta de dados clínicos, de forma a auxiliar os profissionais de saúde nas suas atividades diárias. A principal área de saúde digital abrangida é a Inteligência Artificial (IA), com ênfase em machine learning.

Qual é o contexto?
     Este estudo foi realizado num hospital oncológico de referência que gera grandes volumes de dados clínicos provenientes de atos médicos, diagnósticos, tratamentos e resultados de exames. O processo de consultar e registar corretamente os dados de cada paciente é demorado, o que prolonga as consultas e reduz o tempo dos profissionais de saúde, consequentemente impactando a qualidade das decisões clínicas. A pandemia COVID-19, período em que o estudo foi conduzido, agravou ainda mais estas dificuldades, complicando a alocação de profissionais para as tarefas de anotação dos dados.

Quais são as abordagens atuais?
     Atualmente, a prática de registar informações clínicas em “texto livre” oferece flexibilidade, mas dificulta a extração automática de dados, limitando a aplicação de modelos analíticos. A maior parte dos registos é não estruturada, e o uso de abreviaturas não padronizadas aumenta a ambiguidade, dificultando a interpretação. A revisão manual é lenta e sujeita a erros, enquanto os sistemas de apoio à decisão clínica, que dependem de dados estruturados, são ineficazes para “texto livre”. O uso de text mining e processamento de linguagem natural na saúde ainda está numa fase inicial, sem uma aplicação generalizada em contextos clínicos.

Em que consiste a inovação? Como é que é avaliado o impacto deste estudo?
     A inovação deste estudo consiste na criação de um repositório de dados estruturados que alimenta os sistemas de apoio à decisão clínica. Este repositório é construído a partir da transformação dos registos dos pacientes (diários clínicos) escritos em “texto livre” em dados estruturados, através de text mining e processamento de linguagem natural.

     O processo começa com a extração de texto a partir dos documentos PDF, seguida da normalização, que inclui a correção das frases e a substituição de abreviaturas pelos seus termos completos. Com o texto já normalizado, procede-se à identificação das 3 categorias ou entidades a que os dados se referem: ‘Procedimentos’, ‘Doenças’ ou ‘Medicamentos’ através de algoritmos de text mining. O processamento de linguagem natural é utilizado para a análise e compreensão dos textos.

     Neste estudo foram utilizados 2 processos clínicos e aplicados 2 modelos de treino dos algoritmos. No modelo semi-supervisionado, o treino foi realizado associando automaticamente o vocabulário biomédico do UMLS (Sistema Unificado de Linguagem Médica) às 3 categorias enquanto no modelo supervisionado, o treino foi realizado através da identificação manual das categorias por 2 anotadores humanos (A e B). O estudo também incluiu a validação clínica dos algoritmos de text mining no contexto oncológico, assegurando a relevância prática e a aplicabilidade dos modelos desenvolvidos. O impacto dos modelos foi avaliado através de métricas de desempenho como precisão além de uma análise qualitativa realizada por um médico sénior. 

Quais são os principais resultados? Qual é o impacto destes resultados? Qual é o futuro desta tecnologia?
     O modelo semi-supervisionado apresentou um resultado de precisão de 86,6%, enquanto o modelo supervisionado obteve 63,8% de precisão com o anotador A e 65,7% com o anotador B. A análise qualitativa revelou que ambos os modelos deixaram algumas categorias/entidades por identificar em determinadas frases. Embora os resultados sejam promissores, há necessidade de reforçar a formação dos anotadores e treinar os algoritmos com mais dados validados.

     O impacto destes resultados é significativo, pois demonstra que é possível criar ferramentas de apoio à decisão clínica. A utilização de dados estruturados permitirá a criação de dashboards intuitivos que apresentem informações críticas, como diagnósticos, medicação, e até uma linha temporal detalhada com o histórico clínico do paciente. Esta organização oferecerá uma visão clara e rápida das condições do doente, auxiliando os profissionais de saúde na tomada de decisões mais informadas e diminuindo o tempo de análise de grandes volumes de “texto livre”.

     No futuro, esta ferramenta pode ser ampliada para integrar IA, ajudando a comparar tratamentos e prever resultados com base em dados de pacientes semelhantes, cruzando informações com normas internacionais e evidências científicas. Com isso, a ferramenta proporcionará uma maior personalização dos tratamentos e otimização de recursos. Ao reduzir redundâncias, como a repetição de exames, e melhorar a eficiência dos processos clínicos, a tecnologia poderá impactar diretamente a qualidade dos cuidados de saúde e reduzir os custos.

Sistema robótico autónomo INSIDE

Sistema robótico autónomo para a terapia do autismo

O transtorno do espetro do autismo é uma condição do neurodesenvolvimento com repercussões clínicas, sociais e económicas significativas ao longo da vida. Segundo a Organização Mundial de Saúde, estima-se que afete aproximadamente 1 em cada…

Ler mais
troca de informações de saúde e interoperabilidade

A nova era da interoperabilidade em sistemas de saúde

A crescente utilização de registos eletrónicos de saúde, sistemas de diagnóstico digital e tecnologias de monitorização remota tem levado a um aumento expressivo no volume e na complexidade dos dados em saúde. Este aumento intensifica…

Ler mais
robótica colaborativa

Robótica colaborativa melhora as condições de trabalho

Os trabalhadores enfrentam desafios crescentes no ambiente industrial. Entre os mais críticos estão a fadiga e as posturas inadequadas, frequentemente associadas a tarefas repetitivas e a condições de trabalho que carecem de adequação ergonómica. Estes…

Ler mais
Benefícios da Eletrônica Médica

Deteção da ansiedade e de ataques de pânico em tempo real

O crescente número de pessoas com transtornos de ansiedade, juntamente com o aumento da conscientização sobre a saúde mental, impulsiona a necessidade de novas ferramentas tecnológicas que forneçam a monitorização remota e contínua de transtornos…

Ler mais
Personalização e tecnologia na gestão da Diabetes

Personalização e tecnologia na gestão da diabetes

A crescente prevalência de doenças crónicas, particularmente DM, está a sobrecarregar os sistemas de saúde globais e a aumentar os custos dos cuidados de saúde devido à complexidade dos cuidados e à fraca integração, resultando…

Ler mais
TEF-HEALTH Logo

SPMS integra a iniciativa TEF-Health

A SPMS participa na iniciativa TEF-Health como parceira de um consórcio composto por 51 entidades de 9 países da União Europeia. Esta ação é cofinanciada pela Comissão Europeia e tem uma duração de cinco anos….

Ler mais
Global Digital Health Partnership Logo

SPMS representa Portugal como vice-presidente da GDHP

A GDHP é uma organização intergovernamental da área da saúde digital que facilita a cooperação e colaboração entre representantes governamentais e a Organização Mundial da Saúde (OMS), cujo propósito é fomentar o desenvolvimento de políticas…

Ler mais
HealthData@PT Logo

HealthData@PT: Nova iniciativa da SPMS para dados de saúde

A ação HealthData@PT é lançada no contexto da implementação do Espaço Europeu de Dados de Saúde, sendo uma iniciativa aprovada pela Comissão Europeia no âmbito do programa EU4Health 2021-2027. Esta iniciativa contribui para a transformação…

Ler mais

tem uma ideia inovadora
na área da saúde?

Partilhe-a connosco e veja-a ganhar vida.
Ajudamos a dar vida aos seus projetos!

Newsletter

Receba as novidades do
Portal InovarSaúde

República Portuguesa logo
SNS Logo
SPMS Logo

Acompanhe-nos

Cofinanciado por :

PRR Logotipo
República Portuguesa logo
União Europeia Logo
Scroll to Top