Nuevos artículos

La obesidad como «acelerador del tiempo»: se detectan señales moleculares de envejecimiento prematuro en personas de 30 años
Estatinas vs. Metástasis: La atorvastatina frena el cáncer de pulmón mesenquimal
Cúrcuma vs. centímetros de más: Qué revela un metaanálisis sobre la prediabetes y la diabetes tipo 2
Jengibre sin mitos: Lo que los metaanálisis realmente revelan sobre la inflamación, la diabetes y las náuseas durante el embarazo
Nanocuerpos contra el cáncer de pulmón: administrar quimioterapia directamente al tumor
Los genes del Alzheimer no son iguales para todos: un estudio descubre 133 nuevas variantes de riesgo
Las células inmunes modificadas genéticamente muestran potencial para prevenir el rechazo de órganos
Dispositivo portátil permite monitorizar los síntomas del Parkinson en casa
Calorías a simple vista: por qué casi siempre no alcanzamos el objetivo y qué tiene que ver el IMC con ello
¿Efectos de Ozempic en el cerebro? Semaglutida y tirzepatida se relacionan con un menor riesgo de demencia y accidente cerebrovascular isquémico.

La voz como análisis: señales tempranas de cáncer y lesiones benignas

Alexey Kryvenko, Revisor médico
Último revisado: 18.08.2025

Todo el contenido de iLive se revisa médicamente o se verifica para asegurar la mayor precisión posible.

Tenemos pautas de abastecimiento estrictas y solo estamos vinculados a sitios de medios acreditados, instituciones de investigación académica y, siempre que sea posible, estudios con revisión médica. Tenga en cuenta que los números entre paréntesis ([1], [2], etc.) son enlaces a estos estudios en los que se puede hacer clic.

Si considera que alguno de nuestros contenidos es incorrecto, está desactualizado o es cuestionable, selecciónelo y presione Ctrl + Intro.

12 August 2025, 08:13

Investigadores de la Universidad de Salud y Ciencias de Oregón analizaron grabaciones de voz del nuevo conjunto de datos Bridge2AI-Voice, disponible públicamente, y descubrieron una característica acústica simple que puede revelar patología de las cuerdas vocales. Se trata de la relación armónico-ruido (HNR), la proporción entre los armónicos y el ruido. Su nivel y variabilidad permitieron distinguir las voces de personas con cáncer de laringe y lesiones benignas de las de personas sanas y con otros trastornos de la voz. El efecto fue especialmente evidente en hombres cisgénero; la significación estadística no fue suficiente en el caso de las mujeres; los autores atribuyen esta afirmación al pequeño tamaño de la muestra y solicitan una ampliación de los datos. El trabajo se publicó como un breve informe en Frontiers in Digital Health.

Antecedentes del estudio

¿Para qué buscar "marcadores de voz"? La ronquera es una queja común. Las causas son diversas: desde resfriados y reflujo hasta nódulos/pólipos y cáncer de laringe. Actualmente, el diagnóstico se realiza mediante una visita a un otorrinolaringólogo y una endoscopia (una cámara en la nariz y la garganta). Si bien es precisa, no siempre está disponible rápidamente y no es adecuada para el autocontrol en casa. Es necesaria una evaluación previa: una forma sencilla de saber quién debe consultar primero con un médico.
¿Qué es un biomarcador de voz? El habla es una señal que se puede grabar fácilmente en un teléfono. Su patrón permite evaluar la vibración de las cuerdas vocales. Las lesiones hacen que las vibraciones sean desiguales: más ruido y menos música.
Por qué son importantes los nuevos conjuntos de datos. Anteriormente, estos trabajos se basaban en muestras pequeñas y caseras; los modelos eran frágiles. Bridge2AI-Voice es un amplio conjunto multicéntrico de grabaciones de audio, recopiladas éticamente y vinculadas a diagnósticos. Se creó como un campo de pruebas común para entrenar y probar algoritmos con datos grandes y heterogéneos.
¿Dónde están las principales dificultades?
- La voz cambia debido al micrófono, el ruido de la habitación, el frío, el tabaco, el idioma, el género y la edad.
- Tradicionalmente, hay menos datos femeninos y la voz femenina tiene mayor frecuencia: las métricas se comportan de manera diferente.
- Ninguna prueba “casera” puede sustituir una exploración o hacer un diagnóstico; como mucho, ayuda a decidir: “¿es necesario acudir urgentemente a un otorrinolaringólogo?”.
¿Por qué la clínica y los pacientes necesitan esto? Si se puede seleccionar a personas con alto riesgo de ganglios linfáticos/tumores para una cita prioritaria mediante una cita breve, se agilizarán los diagnósticos, se reducirán las derivaciones innecesarias y se proporcionará una herramienta para el autocontrol entre visitas (después de la cirugía, durante la terapia).
A dónde debería conducir esto: A aplicaciones/módulos de telemedicina validados que:
1. escribe un discurso según el estándar (frase + “aaa” prolongada),
2. Calcular características básicas (HNR, fluctuación, brillo, F0),
3. emitir una recomendación para contactar a un especialista si el perfil es alarmante,
4. Mantener la dinámica después del tratamiento.

La idea es sencilla: “poner el teléfono en la oreja de un otorrinolaringólogo”, no para que haga un diagnóstico, sino para no perder de vista a quienes necesitan ayuda rápida en persona.

¿Qué hicieron exactamente?

Realizamos el primer lanzamiento del conjunto de datos Bridge2AI-Voice, recopilado de forma ética y multicéntrico, un proyecto insignia del NIH en el que las grabaciones de voz se vinculan a información clínica (diagnósticos, cuestionarios, etc.).
Se formaron dos muestras analíticas:
1. "cáncer de laringe / ganglios benignos / sanos";
2. “nódulos cancerosos o benignos” versus disfonía espasmódica y parálisis de las cuerdas vocales (otras causas comunes de ronquera).
Se identificaron las características vocales básicas a partir de frases estandarizadas: tono fundamental (F0), fluctuación, brillo y HNR, y los grupos se compararon mediante estadística no paramétrica. Resultado: las diferencias más estables se observaron en HNR y F0, siendo HNR y su variabilidad los que mejor diferenciaron las lesiones benignas de la normalidad y el cáncer de laringe. Estas señales fueron más distintivas en los hombres.

¿Por qué es esto importante?

Detección temprana sin sonda. Actualmente, el diagnóstico suele consistir en una nasoendoscopia y, si se sospecha, una biopsia. Si las características acústicas simples, combinadas con IA, permiten priorizar a quienes necesitan una endoscopia, los pacientes accederán antes a un otorrinolaringólogo y se reducirán las derivaciones innecesarias. Esto complementa, no reemplaza, al médico.
Big data para voz. Bridge2AI-Voice es un proyecto excepcional donde la voz se recopila mediante protocolos uniformes y se vincula con diagnósticos. Los datos están disponibles para los investigadores a través de PhysioNet/Health Data Nexus. Esto acelera el desarrollo de biomarcadores de voz fiables en lugar de aplicaciones milagrosas basadas en muestras pequeñas.

¿Qué es HNR?

Cuando hablamos, las cuerdas vocales vibran y crean sobretonos (armónicos). Pero la vibración nunca es perfecta; siempre hay ruido en la señal. La HNR se refiere simplemente a cuánta más "música" hay en la voz que "silbido". Cuando las cuerdas vocales se dañan, la vibración se vuelve menos uniforme: hay más ruido, la HNR disminuye y sus saltos (variabilidad) aumentan. Este es el patrón que detectaron los autores.

Descargos de responsabilidad importantes

Este es un análisis piloto exploratorio: sin validación clínica, con restricciones en la muestra de mujeres, por lo que sus efectos no fueron significativos. Se requieren datos más amplios y diversos, así como una evaluación comparativa de los modelos en diferentes clínicas y en diferentes idiomas.
La voz tiene múltiples significados: se ve afectada por un resfriado, el tabaco, el reflujo, un micrófono o el ruido en la habitación. Cualquier prueba casera debería tener en cuenta el contexto y, además, servir como filtro para la derivación a un otorrinolaringólogo, en lugar de un diagnóstico rápido.

¿Que sigue?

Ampliar el conjunto de datos (incluyendo mujeres y edades), estandarizar las tareas y la acústica (leer una frase, “aaa” prolongado, etc.), probar modelos multimodales (voz + cuestionario de síntomas/factores de riesgo).
Vincular los signos acústicos con los resultados de los exámenes (endoscopia, estroboscopia) y la dinámica después del tratamiento, de modo que el perfil HNR también se pueda utilizar para la monitorización.
Continuamos con la “ciencia abierta”: Bridge2AI-Voice ya está publicando versiones del conjunto de datos y herramientas: esta es una oportunidad para llegar rápidamente a pilotos reales en clínicas.

Conclusión

Es posible detectar problemas de las cuerdas vocales a partir de la voz, y quizás derivar a la persona al especialista adecuado con mayor rapidez. Por ahora, es una pista bastante clara (la HNR y su variabilidad), pero gracias al big data abierto, los biomarcadores de voz finalmente tienen la oportunidad de convertirse en una herramienta de detección fiable.

Fuente: Jenkins P. et al. La voz como biomarcador: análisis exploratorio de lesiones benignas y malignas de las cuerdas vocales. Frontiers in Digital Health, 2025 (aceptado para publicación). Datos: Bridge2AI-Voice (NIH/PhysioNet).