Proceder al sitio como profesional sanitario
La inteligencia artificial (IA) desempeña un papel cada vez más relevante en nuestras vidas y ha demostrado ser prometedora para abordar algunos de los mayores retos sociales actuales y futuros a los que nos enfrentamos. El sector sanitario, a pesar de su notoria complejidad y resistencia a la disrupción, puede beneficiarse significativamente del uso de la IA. Con un historial consolidado de liderazgo en la transformación digital de la atención sanitaria y una necesidad urgente de mejorar la eficiencia, la radiología se encuentra a la vanguardia en la exploración y el aprovechamiento del potencial de la IA.
Este libro aborda cómo y por qué la IA puede resolver los retos a los que se enfrentan las unidades de radiología, ofrece una visión general de los conceptos fundamentales relacionados con la IA y describe algunos de los casos de uso más prometedores de la IA en radiología. Además, se analizan los principales retos asociados a la adopción de la IA en la práctica radiológica habitual. El libro también abarca algunos aspectos esenciales que las unidades de radiología deben tener en cuenta a la hora de decidir qué soluciones basadas en IA adquirir. Por último, ofrece una visión de los aspectos emergentes y en constante evolución de la IA en el campo de la radiología que cabe esperar en un futuro próximo.
La inteligencia artificial en la radiología
En las últimas décadas, el sector sanitario ha experimentado una serie de tendencias que exigen un cambio en ciertas formas de actuar. Estas tendencias son especialmente significativas en el campo de la radiología, en el cual, la calidad diagnóstica de las exploraciones por imagen ha mejorado drásticamente, a la vez que se han reducido los tiempos de exploración. Como resultado, la cantidad y la complejidad de los datos obtenidos en imágenes médicas han aumentado sustancialmente (Smith-Bindman et al., 2019; Winder et al., 2021), y se prevé que sigan aumentando también en el futuro (Tsao, 2020). Este problema se complica por una escasez mundial generalizada de radiólogos (AAMC Report Reinforces Mounting Physician Shortage, 2021, Clinical Radiology UK Workforce Census 2019 Report, 2019). Los profesionales sanitarios, incluidos los radiólogos, deben hacer frente a una carga de trabajo cada vez mayor (Bruls y Kwee, 2020; Levin et al., 2017), lo que contribuye al agotamiento y a posibles errores médicos (Harry et al., 2021). Dado que la radiología es un proveedor de servicios esencial para prácticamente todas las demás unidades hospitalarias, la escasez de personal en este campo tiene efectos significativos que se extienden por todo el hospital y afectan a la sociedad en su conjunto (England & Improvement, 2019; Sutherland et al., s.f.). Con el envejecimiento de la población mundial y el aumento de la carga de enfermedades crónicas, se prevé que estos problemas supongan un reto aún mayor para el sector sanitario en el futuro.
Las soluciones de diagnóstico médico por la imagen basadas en la IA tienen el potencial de mejorar estos retos por varias razones. Son especialmente adecuadas para gestionar conjuntos de datos grandes y complejos (Alzubaidi et al., 2021). Además, son muy adecuadas para automatizar algunas de las tareas que tradicionalmente realizan radiólogos y radiógrafos, lo que puede liberar tiempo y hacer que los flujos de trabajo dentro de los departamentos de radiología sean más eficientes (Allen et al., 2021; Baltruschat et al., 2021; Kalra et al., 2020; O'Neill et al., 2021; van Leeuwen et al., 2021; Wong et al., 2019). La inteligencia artificial también tiene la capacidad de detectar patrones complejos de los datos que los seres humanos no siempre pueden identificar o cuantificar (Dance, 2021; Korteling et al., 2021; Kühl et al., 2020).
Fundamentos de la inteligencia artificial
El término «inteligencia artificial» se refiere al uso de sistemas informáticos para resolver problemas específicos de una forma que simula el razonamiento humano. Una característica fundamental de la IA es que, al igual que los seres humanos, puede adaptar sus soluciones a circunstancias cambiantes. Se debe tener en cuenta que, si bien estos sistemas están destinados a imitar cómo piensan los seres humanos a nivel fundamental, su capacidad para hacerlo (por ejemplo, en términos de la cantidad de datos que pueden manejar al mismo tiempo, la naturaleza y la cantidad de patrones que pueden encontrar en los datos y la velocidad a la que lo hacen) a menudo supera la de los seres humanos.
Las soluciones de IA se presentan en forma de algoritmos informáticos, que son fragmentos de código informático que representan instrucciones que se deben seguir para resolver un problema específico. En su forma más fundamental, el algoritmo toma datos como entrada, realiza algún cálculo sobre esos datos y devuelve una salida.
Un algoritmo de IA puede programarse explícitamente para resolver una tarea específica, de forma análoga a una receta paso a paso para hornear un pastel. Por otro lado, el algoritmo puede programarse para buscar patrones en los datos, con el fin de resolver el problema. Este tipo de algoritmos se conocen como algoritmos de aprendizaje automático. TPor tanto, todos los algoritmos de aprendizaje automático son IA, pero no toda la IA es aprendizaje automático. Los patrones de los datos que el algoritmo puede programar explícitamente para buscar o que puede «descubrir» por sí mismo se conocen como características. Una característica importante del aprendizaje automático es que dichos algoritmos aprenden de los propios datos, y su rendimiento mejora cuantos más datos se les dan.
Uno de los usos más habituales del aprendizaje automático es la clasificación: asignar a un dato una etiqueta particular. Así, por ejemplo, se puede utilizar un algoritmo de aprendizaje automático para saber si una foto (la entrada) muestra un perro o un gato (la etiqueta). El algoritmo puede aprender a hacerlo de forma supervisada o no supervisada.
Aprendizaje supervisado
En el aprendizaje supervisado, el algoritmo de aprendizaje automático recibe datos que han sido etiquetados como referencia, tal y como se puede ver en este ejemplo en fotos de perros y gatos que han sido etiquetadas. A continuación, el proceso pasa por las siguientes fases:
1.Fase de entrenamiento: el algoritmo aprende las características asociadas a perros y gatos utilizando los datos mencionados (datos de entrenamiento).
2.Fase de prueba: a continuación, el algoritmo recibe un nuevo conjunto de fotos (los datos de prueba), las etiqueta y se evalúa el rendimiento del algoritmo con esos datos.
En algunos casos, existe una fase intermedia entre la fase de entrenamiento y la de prueba, conocida como fase de validación. En esta fase, el algoritmo recibe un nuevo conjunto de fotos (no incluidas ni en los datos de entrenamiento ni en los de prueba), se evalúa su rendimiento con estos datos y el modelo se ajusta y se vuelve a entrenar con los datos de entrenamiento. Esto se repite hasta que se alcanza algún criterio predefinido basado en el rendimiento, y entonces el algoritmo entra en la fase de prueba.
Aprendizaje sin supervisión
En el aprendizaje no supervisado, el algoritmo identifica características en los datos de entrada que le permiten asignar clases a los puntos de datos individuales, sin que se le indique explícitamente cuáles son o deben ser esas clases. Estos algoritmos pueden identificar patrones o agrupar puntos de datos sin intervención humana, e incluyen algoritmos de agrupación y reducción dimensional.
No todos los algoritmos de aprendizaje automático realizan una clasificación. Algunos se utilizan para predecir una métrica continua (por ejemplo, la temperatura dentro de cuatro semanas) en lugar de una etiqueta discreta (por ejemplo, gatos frente a perros). Estos se conocen como algoritmos de regresión.
Redes neuronales y aprendizaje profundo
Una red neuronal está formada por una capa de entrada y una capa de salida, que a su vez están compuestas por nodos. En las redes neuronales simples, las características derivadas manualmente de un conjunto de datos se introducen en la capa de entrada, que realiza algunos cálculos cuyos resultados se transmiten a la capa de salida. En el aprendizaje profundo, existen múltiples capas «ocultas» entre las capas de entrada y salida. Cada nodo de las capas ocultas realiza cálculos utilizando determinados pesos y transmite la salida a la siguiente capa oculta, hasta llegar a la capa de salida.
Al principio, se asignan valores aleatorios a los pesos y se calcula la precisión del algoritmo. A continuación, los valores de los pesos se ajustan iterativamente hasta encontrar un conjunto de valores que maximice la precisión. En general, este ajuste iterativo de los valores se realiza retrocediendo desde la capa de salida a la capa de entrada, una técnica llamada retropropagación. Todo este proceso se realiza sobre los datos de entrenamiento.
Evaluación del rendimiento
Comprender cómo se evalúa el rendimiento de los algoritmos de IA es clave para interpretar la literatura existente sobre esta tecnología. Existen varias métricas de rendimiento para evaluar lo bien que un modelo realiza determinadas tareas. Ninguna métrica es perfecta, por lo que una combinación de varias métricas proporciona una imagen más completa del rendimiento del modelo.
Las métricas más utilizadas en la regresión, son:
- Error absoluto medio (EAM): diferencia media entre los valores previstos y el valor real que se utiliza como referencia.
- Raíz del error cuadrático medio (RECM): las diferencias entre los valores predichos y el valor real que se utiliza como referencial se elevan al cuadrado y se promedian sobre la muestra. A continuación, se realiza la raíz cuadrada de la media. A diferencia del EAM, la RECM otorga mayor peso a las diferencias más grandes.
- R2: proporción de la varianza total en el valor real que se utiliza de referencia por la varianza en los valores predichos. Va de 0 a 1.
En las tareas de clasificación suelen utilizarse las siguiente métricas:
- Precisión: proporción de todas las predicciones que se han hecho correctamente. Va de 0 a 1.
- Sensibilidad: también conocida como tasa de verdaderos positivos (TVP) o recall, es la proporción de verdaderos positivos que se han predicho correctamente. Va de 0 a 1.
- Especificidad: también conocida como tasa de verdaderos negativos (TVN), es la proporción de verdaderos negativos que se han predicho correctamente. Va de 0 a 1.
- Precisión: también conocida como valor predictivo positivo (VPP), es la proporción de clasificaciones positivas que se han predicho correctamente. Va de 0 a 1.
Existe un equilibrio inherente entre la sensibilidad y la especificidad. La importancia de cada uno de ellos, así como su interpretación, depende en gran medida de la pregunta de investigación específica y de la tarea de clasificación.
Es importante destacar que, aunque los modelos de clasificación pretenden llegar a una conclusión binaria, están inherentemente basados en la probabilidad. Esto significa que estos modelos arrojarán una probabilidad de que un punto de datos pertenezca a una u otra clase. Para llegar a una conclusión sobre la clase más probable, se utiliza un umbral. Métricas como la exactitud, la sensibilidad, la especificidad y la precisión se refieren al rendimiento del algoritmo en función de un determinado umbral. El área bajo la curva característica operativa del receptor (AUC) es una métrica de rendimiento independiente de dicho umbral. El AUC puede interpretarse como la probabilidad de que el algoritmo clasifique mejor un ejemplo positivo aleatorio que un ejemplo negativo aleatorio.
En las tareas de segmentación de imágenes, que son un tipo de tarea de clasificación, se suelen utilizar las siguientes métricas:
- Coeficiente de similitud de dados: medida de superposición entre dos conjuntos (por ejemplo, dos imágenes) que se calcula como el doble del número de elementos comunes a los conjuntos dividido por la suma del número de elementos de cada conjunto. Varía de 0 (sin superposición) a 1 (superposición perfecta).
- Distancia de Hausdorff: medida de la distancia entre dos conjuntos (por ejemplo, dos imágenes) dentro de un espacio. Básicamente, es la mayor distancia entre un punto de un conjunto y el punto más cercano del otro conjunto.
Validez interna y externa
Los modelos internamente válidos desempeñan bien su tarea en los datos que se utilizan para entrenarlos y validarlos. El grado de validez interna se evalúa mediante los parámetros de rendimiento descritos anteriormente y depende de las características del propio modelo y de la calidad de los datos con los que se ha entrenado y validado.
Los modelos externamente válidos demuestran un buen rendimiento en tareas con datos nuevos (Ramspek et al., 2021). Cuanto mejor funcione el modelo con datos que difieran de los datos con los que se entrenaron y validaron los modelos, mayor será la validez externa. En la práctica, esto implica evaluar el desempeño de los modelos utilizando datos de hospitales o áreas geográficas que no formaron parte de los conjuntos de entrenamiento y validación.
Directrices para evaluar la investigación en IA
Se han elaborado varias directrices para evaluar la evidencia que sustenta las intervenciones basadas en la IA en la asistencia sanitaria (X. Liu et al., 2020; Mongan et al., 2020; Shelmerdine et al., 2021; Weikert et al., 2021). Estas proporcionan un modelo para quienes investigan la IA en la atención sanitaria y garantizan que la información pertinente se comunique de forma transparente y exhaustiva, pero también pueden ser utilizados por otras partes interesadas para evaluar la calidad de la investigación publicada. Esto ayuda a garantizar que las soluciones basadas en IA con limitaciones potenciales o reales sustanciales en particular aquellas causadas por informes deficientes (Bozkurt et al., 2020; D. W. Kim y otros, 2019; X. Liu et al., 2019; Nagendran et al., 2020; Yusuf et al., 2020), no se adopten prematuramente (CONSORT-AI y SPIRITAI Steering Group, 2019). Asimismo, también se han propuesto directrices para evaluar la fiabilidad de las soluciones basadas en IA en términos de transparencia, confidencialidad, seguridad y responsabilidad (Buruk et al., 2020; Lekadir et al., 2021; Zicari et al., 2021).
Usos clínicos
En los últimos años, la IA ha demostrado un gran potencial para abordar una amplia gama de tareas en las unidades de diagnóstico por la imagen, incluyendo muchas de las que se realizan antes de realizar las pruebas médicas. Las implementaciones de IA para mejorar la eficiencia de los flujos de trabajo radiológicos previos a la exploración del paciente se denominan a veces «IA ascendente» (Kapoor et al., 2020; M. L. Richardson et al., 2021).
Programación de las citas
Una aplicación prometedora de IA es predecir qué pacientes tienen más probabilidades de no acudir a sus citas de exploración. Las citas perdidas se asocian con un aumento significativo de la carga de trabajo y los costes (Dantas et al., 2018). Utilizando un enfoque de aumento de gradiente, Nelson et al. predijeron con gran precisión las citas de resonancia magnética (RM) hospitalarias perdidas en el Servicio Nacional de Salud (NHS) del Reino Unido (Nelson et al., 2019). Las simulaciones también indicaron que tomar medidas basadas en las predicciones de este modelo, dirigiéndose a los pacientes que probablemente falten a sus citas, podría generar un beneficio neto potencial de varias libras por cita, considerando una variedad de umbrales del modelo y tasas de citas perdidas (Nelson et al., 2019). Recientemente, se han obtenido resultados similares en un estudio realizado en un único hospital de Singapur. Durante los seis meses siguientes a la implantación de la herramienta predictiva, lograron reducir significativamente la tasa de pacientes que no acudían a sus citas del 19,3 % al 15,9 %, lo que se tradujo en un beneficio económico potencial de 180 000 dólares (Chong et. al., 2020).
La programación de las pruebas en un servicio de radiología es una tarea ardua ya que, aunque se trata en gran medida de una tarea administrativa, depende en gran medida de la información médica. La asignación de pacientes a citas específicas suele depender de personas con conocimientos en el ámbito. Esto implica que la persona encargada de programar las citas debe ser un radiólogo o un técnico de radiología, o bien estas personas deben proporcionar información de manera regular. En cualquiera de los dos casos, el proceso es algo ineficaz y puede racionalizarse mediante algoritmos basados en IA que comprueben las indicaciones y contraindicaciones de las exploraciones y proporcionen a las personas que las programan información sobre su urgencia (Letourneau-Guillon et al., 2020).
Protocolo
Dependiendo de la política del hospital o de la clínica, la decisión sobre el protocolo exacto de exploración que sigue un paciente suele tomarse basándose en la información de la solicitud del médico y en el criterio del radiólogo. A menudo, esto se complementa con la comunicación directa entre el médico remitente y el radiólogo, y la revisión por parte del radiólogo de la información médica del paciente. Este proceso mejora la atención al paciente (Boland et al., 2014), pero puede llevar mucho tiempo y ser ineficaz, sobre todo con modalidades como la RM, en la que existe un gran número de cambios de protocolos. En un estudio, la elaboración de protocolos por sí sola representó alrededor del 6 % del tiempo de trabajo del radiólogo (Schemmel et al., 2016). Los radiólogos también suelen verse interrumpidos por tareas como la protocolización a la hora de interpretar imágenes, a pesar de que esta última se considera la responsabilidad principal de un radiólogo (Balint et al., 2014; J.-P. J. Yu et al., 2014).
Se ha intentado interpretar el texto narrativo de la solicitud del médico remitente utilizando clasificadores de lenguaje natural, la misma tecnología utilizada en chatbots y asistentes virtuales. Los clasificadores de lenguaje natural basados en aprendizaje profundo han demostrado ser prometedores en la asignación de pacientes a un protocolo de RM con o sin contraste en la RM osteomuscular, con una precisión del 83 % (Trivedi et al., 2018) y del 94 % (Y. H. Lee, 2018). Algoritmos similares han mostrado una precisión del 95 % en la predicción del protocolo de RM cerebral adecuado utilizando una combinación de hasta 41 secuencias de RM diferentes (Brown y Marotta, 2018). En una amplia gama de regiones del cuerpo, un clasificador de lenguaje natural basado en el aprendizaje profundo decidió, basándose en el texto narrativo de las solicitudes de exploración, si asignar automáticamente un protocolo específico de tomografía computarizada (TC) o de resonancia magnética (con una precisión del 95 %) o, en casos más difíciles, recomendar al radiólogo una lista de los tres protocolos más adecuados (con una precisión del 92 %) (Kalra et al., 2020).
La IA también se ha utilizado para decidir si es necesario ampliar exploraciones ya protocolizadas, una decisión que debe tomarse en tiempo real mientras el paciente se encuentra dentro del escáner. Un ejemplo de ello es la resonancia magnética de próstata, en la que la decisión de administrar o no un medio de contraste suele tomarse después de las secuencias sin contraste. Hötker et al. hallaron que una red neuronal convolucional (CNN) asignaba el 78 % de los pacientes al protocolo de RM de próstata adecuado (Hötker et al., 2021). La sensibilidad de la CNN para detectar la necesidad de utilizar el medio de contraste fue del 94,4 %, con una especificidad del 68,8 %. Solo fue necesario someter al 2 % de los pacientes del estudio a una exploración adicional con contraste (Hötker et al., 2021).
Mejora y monitorización de la calidad de las imágenes
Recientemente, se han creado numerosas soluciones basadas en IA que funcionan en segundo plano en los flujos de trabajo radiológicos para mejorar la calidad de las imágenes. Entre ellas se incluyen soluciones para controlar la calidad de las imágenes, reducir los artefactos de imagen, mejorar la resolución espacial y acelerar las exploraciones.
Este tipo de soluciones se están incorporando a la radiología, sobre todo en el caso de la tomografía computarizada, que durante décadas utilizó métodos consolidados, pero propensos a los artefactos, para reconstruir imágenes interpretables a partir de los datos brutos del sensor (Deák et al., 2013; Singh et al., 2010). Estos están siendo reemplazados gradualmente por métodos de reconstrucción basados en aprendizaje profundo, que mejoran la calidad de la imagen manteniendo bajas dosis de radiación (Akagi et al., 2019; H. Chen et al., 2017; Choe et al., 2019; Shan et al., 2019).
Esta reconstrucción se realiza en superordenadores en el propio escáner de TC o en la nube. El equilibrio entre la dosis de radiación y la calidad de la imagen puede ajustarse en función del protocolo para adaptar las exploraciones a pacientes individuales y situaciones clínicas (McLeavy et al., 2021; Willemink & Noël, 2019). Estos enfoques se han utilizado especialmente en exploraciones de niños, mujeres embarazadas y pacientes obesos, así como en exploraciones por TC de las vías urinarias y el corazón (McLeavy et al., 2021).
También se han utilizado soluciones basadas en IA para acelerar las exploraciones manteniendo la calidad del diagnóstico. La reducción del tiempo de exploración no solo mejora la eficiencia general del proceso, sino que también contribuye a mejorar la experiencia general del paciente y el cumplimiento de las pruebas de diagnóstico por la imagen. En un estudio multicéntrico de resonancia magnética de columna, se halló que un algoritmo de reconstrucción de imágenes basado en el aprendizaje profundo, que mejoraba las imágenes mediante el filtrado y la reducción del ruido preservando los detalles, reducía el tiempo de exploración en un 40 % (Bash, Johnson y otros, 2021). En el caso de las exploraciones cerebrales por RM ponderada en T1, un algoritmo similar que mejora la nitidez de la imagen y reduce el ruido de la misma redujo el tiempo de exploración en un 60 %, manteniendo al mismo tiempo la precisión de la volumetría de las regiones cerebrales en comparación con las exploraciones estándar (Bash, Wang, et al., 2021).
En la práctica radiológica habitual, las imágenes suelen contener artefactos, lo que dificulta su interpretación. Estos artefactos se deben a características específicas de la modalidad o protocolo de imagen utilizados, así como a factores intrínsecos del paciente explorado, como la presencia de cuerpos extraños o el movimiento del paciente durante la exploración. Especialmente en el caso de la RM, los protocolos de obtención de imágenes que exigen una exploración rápida suelen introducir ciertos artefactos en la imagen reconstruida. En un estudio, un algoritmo basado en el aprendizaje profundo redujo los artefactos de bandas asociados a secuencias de RM de precesión libre en estado estacionario equilibradas del cerebro y la rodilla (K. H. Kim y Park, 2017). En otro un estudio se halló que los artefactos de aliasing introducidos por el submuestreo de datos en imágenes de RM de corazón en tiempo real se redujeron mediante el uso de un enfoque basado en el aprendizaje profundo (Hauptmann et al., 2019). La presencia de cuerpos extraños metálicos, como implantes dentales, ortopédicos o vasculares, es un factor habitual relacionado con el paciente que causa artefactos en las imágenes, tanto en la TC como en la RM (Boas & Fleischmann, 2012; Hargreaves et al., 2011). Aunque todavía no están bien consolidados, se han investigado varios enfoques basados en el aprendizaje profundo para reducir estos artefactos (Ghani & Clem Karl, 2019; Puvanasunthararajah et al., 2021; Zhang & Yu, 2018). En este sentido, se están probando enfoques similares para reducir los artefactos relacionados con el movimiento en la RM (Tamada et al., 2020; B. Zhao et al., 2022).
Las soluciones basadas en la IA para evaluar la calidad de las imágenes podrían reducir la necesidad de pedir a los pacientes que acudan de nuevo al hospital con el fin de repetir las pruebas de diagnóstico por la imagen, un problema habitual en la práctica médica (Hötker et al., 2017). Un algoritmo basado en aprendizaje profundo que identifica la vista radiográfica adquirida y extrae métricas relacionadas con la calidad de las radiografías de tobillo fue capaz de predecir la calidad de las imágenes con una precisión aproximada del 94 % (Mairhöfer et al., 2021). Otro enfoque basado en el aprendizaje profundo fue capaz de predecir exploraciones por resonancia magnética hepática no diagnósticas con un valor predictivo negativo de entre el 86 % y el 94 % (Esses et al., 2018). Este control de calidad automatizado en tiempo real permite a los técnicos radiólogos repetir las exploraciones o realizar exploraciones adicionales con mayor valor diagnóstico.
Priorización de la lectura de las pruebas
Ante la escasez de personal y el creciente número de exploraciones, los radiólogos se enfrentan a extensas listas de pruebas por leer y analizar. Para optimizar la eficiencia y la atención al paciente, se han propuesto soluciones basadas en la IA que priorizan las exploraciones que los radiólogos deben leer e informar primero. Estas soluciones suelen seleccionar imágenes adquiridas en busca de hallazgos que requieran intervención urgente (O’Connor & Bhalla, 2021). En el campo de la neurorradiología se ha estudiado más a fondo, el desplazamiento de tomografías computarizadas en las que se detectó una hemorragia intracraneal mediante una herramienta basada en IA a la parte superior de la lista de lectura redujo en varios minutos el tiempo que tardaron los radiólogos en revisar las imágenes (O'Neill et al., 2021). En otro estudio se observó que la priorización de la lista de trabajo disminuyó el tiempo hasta el diagnóstico (que incluye desde la adquisición de la imagen hasta su visualización por parte del radiólogo y el tiempo para leer e informar las exploraciones) de 512 a 19 minutos en el ámbito ambulatorio (Arbabshirani et al., 2018). Un estudio de simulación en el que se utilizó la priorización de listas de trabajo basada en IA a partir de la identificación de hallazgos urgentes en radiografías de tórax (como neumotórax, derrames pleurales y cuerpos extraños) también halló una reducción significativa del tiempo que se tardaba en ver y notificar las exploraciones, en comparación con la priorización estándar del flujo de trabajo (Baltruschat et al., 2021).
Interpretación de las imágenes
Actualmente, la mayoría de las soluciones basadas en IA disponibles comercialmente en el diagnóstico por la imagen se centran en algún aspecto del análisis e interpretación de las imágenes (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021). Esto incluye segmentar partes de la imagen (por ejemplo, para dirigir la cirugía o la radioterapia), llamar la atención de los radiólogos sobre zonas sospechosas, extraer biomarcadores de imagen (radiómica), comparar imágenes a lo largo del tiempo y llegar a diagnósticos de imagen específicos.
Neurología
- Entre el 29 % y el 38 % de las aplicaciones basadas en IA disponibles comercialmente en radiología (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021).
La mayoría de las soluciones basadas en IA disponibles comercialmente y enfocadas en datos de neuroimagen se centran en la detección y caracterización de afecciones como el ictus isquémico, la hemorragia intracraneal, la demencia y la esclerosis múltiple (Olthof et al., 2020). Varios estudios han demostrado una excelente precisión de los métodos basados en IA para la detección y clasificación de hemorragia intraparenquimatosa, subaracnoidea y subdural en la TC de cabeza (Flanders et al., 2020; Ker et al., 2019; Kuo et al., 2019). Estudios posteriores demostraron que, en comparación con los radiólogos, algunas soluciones basadas en IA ofrecen unas tasas de falsos positivos y negativos sustancialmente inferiores (Ginat, 2020; Rao et al., 2021). En el ictus isquémico, las soluciones basadas en IA se han centrado en gran medida en la cuantificación del núcleo del infarto (Goebel et al., 2018; Maegerlein et al., 2019), la detección de la oclusión de grandes vasos (Matsoukas et al., 2022; Morey et al., 2021; Murray et al., 2020; Shlobin et al., 2022) y la predicción de los resultados del ictus (Bacchi et al., 2020; Nielsen et al., 2018; Y. Yu et al., 2020, 2021).
En la esclerosis múltiple, la IA se ha utilizado para identificar y segmentar lesiones (Nair et al., 2020; S.-H. Wang et al., 2018), lo que puede resultar especialmente útil en el seguimiento longitudinal de los pacientes. También se ha utilizado para extraer características de imagen asociadas con la enfermedad progresiva y la conversión de un síndrome clínicamente aislado a una esclerosis múltiple definitiva (Narayana et al., 2020; Yoo et al., 2019). Otras aplicaciones de la IA en neurorradiología incluyen la detección de aneurismas intracraneales (Faron et al., 2020; Nakao et al., 2018; Ueda et al., 2019) y la segmentación de tumores cerebrales (Kao et al., 2019; Mlynarski et al., 2019; Zhou et al., 2020), así como la predicción de marcadores genéticos de tumores cerebrales a partir de datos de imágenes (Choi et al., 2019; J. Zhao et al., 2020)
Tórax
- Entre el 24 % y el 31 % de las aplicaciones basadas en IA disponibles comercialmente en radiología (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
Al interpretar radiografías de tórax, los radiólogos detectaron hallazgos sustancialmente más críticos y urgentes cuando contaron con la ayuda de un algoritmo basado en aprendizaje profundo, y lo hicieron mucho más rápido que sin el algoritmo (Nam et al., 2021). Asimismo, también se ha hallado que los algoritmos de interpretación de imágenes basados en el aprendizaje profundo mejoran la sensibilidad de los residentes de radiología en la detección de hallazgos urgentes en radiografías de tórax, del 66 % al 73 % (E. J. Hwang, Nam, et al., 2019). Otro estudio que se centró en una gama más amplia de hallazgos en las radiografías de tórax también encontró que los radiólogos asistidos por un algoritmo basado en el aprendizaje profundo tenían una mayor precisión diagnóstica que los radiólogos que evaluaban las radiografías sin ayuda (Seah et al., 2021). Los usos de la IA en radiología de tórax también se extienden a imágenes transversales como la TC. Así, por ejemplo, se halló un algoritmo de aprendizaje profundo que detecta la embolia pulmonar en tomografías computarizadas, con una alta precisión (AUC = 0,85) (Huang, Kothari, et al., 2020). Además, un algoritmo de aprendizaje profundo obtuvo una precisión del 90 % en la detección de la disección aórtica en TC sin contraste, similar al rendimiento de los radiólogos (Hata et al., 2021).
Fuera del ámbito de urgencias, las soluciones basadas en IA se han probado y aplicado ampliamente en la detección sistemática de la tuberculosis en radiografías de tórax (E. J. Hwang, Park, et al., 2019; S. Hwang et al., 2016; Khan et al., 2020; Qin et al., 2019; WHO Operational Handbook on Tuberculosis Module 2: Screening – Systematic Screening for Tuberculosis Disease, s.f.). Asimismo, también han demostrado ser útiles en la detección sistemática del cáncer de pulmón, tanto en la detección de nódulos pulmonares en TC (Setio et al., 2017) como en radiografías de tórax (Li et al., 2020). También se han utilizado para clasificar si los nódulos son probablemente malignos o benignos (Ardila et al., 2019; Bonavita et al., 2020; Ciompi et al., 2017; B. Wu et al., 2018). Además, las soluciones basadas en la IA muestran un gran potencial en el diagnóstico de neumonía, enfermedad pulmonar obstructiva crónica y enfermedad pulmonar intersticial (F. Liu et al., 2021).
Mama
- El 11 % de las aplicaciones basadas en IA disponibles comercialmente en radiología (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021).
Hasta la fecha, numerosos algoritmos basados en inteligencia artificial para la obtención de imágenes de las mamas tienen como objetivo reducir la carga de trabajo de los radiólogos que interpretan las mamografías. Por ejemplo, en un estudio, el uso de algoritmos para seleccionar mamografías negativas se asoció a una reducción de casi una quinta parte en la carga de trabajo de los radiólogos (Yala et al., 2019). Asimismo, en otros estudios en los que se ha reemplazado a segundos lectores de mamografías por algoritmos basados en IA, se ha observado una disminución en los falsos positivos y falsos negativos, así como una reducción del 88 % en la carga de trabajo del segundo lector (McKinney et al., 2020).
También se ha descubierto que las soluciones basadas en IA para mamografías aumentan la precisión diagnóstica de los radiólogos (McKinney et al., 2020; Rodríguez-Ruiz et al., 2019; Watanabe et al., 2019) y se ha comprobado que algunas son muy precisas a la hora de detectar y clasificar de forma independiente las lesiones mamarias (Agnes et al., 2019; Al-Antari et al., 2020; Rodríguez-Ruiz et al., 2019).
A pesar de esto, una revisión sistemática reciente de 36 algoritmos basados en IA halló que estos estudios eran de mala calidad metodológica, y que todos los algoritmos eran menos precisos que el consenso de dos o más radiólogos (Freeman et al., 2021). No obstante, los algoritmos basados en IA han demostrado potencial para extraer características predictivas de cáncer de las mamografías, más allá de la densidad mamaria mamográfica (Arefan et al., 2020; Dembrower et al., 2020; Hinton et al., 2019). Más allá de la mamografía, se han desarrollado soluciones basadas en IA para detectar y clasificar lesiones mamarias mediante ecografías (Akkus et al., 2019; Park et al., 2019; G.-G. Wu et al., 2019) y RM (Herent et al., 2019).
Cardíaca
- El 11 % de las aplicaciones basadas en IA disponibles comercialmente en radiología (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
La radiología cardiaca siempre ha supuesto un reto especial debido a las dificultades inherentes a la adquisición de imágenes de un órgano en constante movimiento. Por ello, se ha beneficiado enormemente de los avances en la tecnología de la imagen y parece que también se beneficiará en gran medida de la IA (Sermesant et al., 2021). La mayoría de las aplicaciones del sistema cardiovascular basadas en IA utilizan datos de RM, TC o ultrasonidos (Weikert et al., 2021). Algunos ejemplos destacados son el cálculo automatizado de la fracción de eyección en la ecocardiografía, la cuantificación de la calcificación de las arterias coronarias en la TC cardíaca, la determinación del volumen del ventrículo derecho en la angiografía pulmonar por TC y la determinación del tamaño y el grosor de las cavidades cardíacas en la RM cardíaca (Medical AI Assessment, s.f., The Futurista médico, s.f.). Las soluciones basadas en inteligencia artificial para predecir la respuesta favorable de pacientes a intervenciones cardíacas, como la terapia de resincronización cardíaca, han demostrado ser muy prometedoras. Estos enfoques utilizan tanto imágenes médicas como parámetros clínicos para lograr resultados más precisos (Cikes et al., 2019; Hu et al., 2019). Los cambios en la resonancia magnética cardíaca que no son fácilmente visibles para los lectores humanos, pero que son potencialmente útiles para diferenciar diferentes tipos de miocardiopatías, también se pueden detectar utilizando IA a través del análisis de textura (Neisius et al., 2019; J. Wang et al., 2020) y otros enfoques radiómicos ( Mancio et al., 2022).
Osteomuscular
- Entre el 7 % y el 11 % de las aplicaciones basadas en IA disponibles comercialmente en radiología (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
Las aplicaciones prometedoras de la IA en la evaluación de músculos, huesos y articulaciones abarcan áreas en las que los evaluadores humanos a menudo muestran poca fiabilidad entre evaluadores y dentro de un mismo evaluador. Ejemplos de estas aplicaciones son la determinación de la edad esquelética basada en radiografías óseas (Halabi et al., 2019; Thodberg et al., 2009) y la detección sistemática de la osteoporosis en radiografías (Kathirvelu et al., 2019; J.-S. Lee et al., 2019) y TC (Pan et al., 2020). Las soluciones basadas en IA también han demostrado ser prometedoras en la detección de fracturas en radiografías y TC (Lindsey et al., 2018; Olczak et al., 2017; Urakawa et al., 2019). Una revisión sistemática de soluciones basadas en IA para la detección de fracturas en diferentes partes del cuerpo reveló áreas bajo la curva (AUC) que variaban entre 0,94 y 1,00, junto con precisiones que oscilaban entre el 77 % y el 98 % (Langerhuizen et al., 2019). Las soluciones basadas en IA también han logrado precisiones similares a las de los radiólogos en la clasificación de la gravedad de los cambios degenerativos de la columna (Jamaludin et al., 2017) y las articulaciones de las extremidades (F. Liu et al., 2018; Thomas et al., 2020). . También se han desarrollado soluciones basadas en IA para determinar el origen de las metástasis esqueléticas (Lang et al., 2019) y la clasificación de tumores óseos primarios (Do et al., 2017).
Abdomen y pelvis
- El 4 % de las aplicaciones basadas en IA disponibles comercialmente en radiología (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
Gran parte de los esfuerzos en el uso de la IA en imágenes abdominales se han centrado hasta ahora en la segmentación automatizada de órganos como el hígado (Dou et al., 2017), el bazo (Moon et al., 2019), el páncreas (Oktay et al., 2018) y los riñones (Sharma et al., 2017). Asimismo, una revisión sistemática de 11 estudios que utilizan el aprendizaje profundo para la detección de masas hepáticas malignas ofreció una precisión de hasta el 97 % y una AUC de hasta 0,92 (Azer, 2019).
Otras aplicaciones de la IA en radiología abdominal incluyen la detección de la fibrosis hepática (He et al., 2019; Yasaka et al., 2018), la enfermedad del hígado graso, el contenido de hierro hepático, la detección de gas abdominal libre en TC, y la volumetría y segmentación automatizadas de la próstata (AI for Radiology, s.f).
Obstáculos para la implementación de la IA
A pesar del enorme potencial de la IA en el ámbito del diagnóstico por la imagen, su implementación y repercusión en la práctica clínica aún no se ha generalizado. La transición de la investigación al ámbito clínico se ve obstaculizada por múltiples problemas complejos e interrelacionados entre sí que, de manera directa o indirecta, reducen la probabilidad de adoptar soluciones basadas en IA. Uno de los principales obstáculos es la falta de confianza en estas soluciones por parte de los principales interesados, como los organismos reguladores, los profesionales de la salud y los pacientes (Cadario et al., 2021; Esmaeilzadeh, 2020; J. P. Richardson et al., 2021; Tucci et al., 2022).
Generalización del uso de la IA
Una de las principales dificultades radica en desarrollar soluciones basadas en inteligencia artificial que sigan funcionando adecuadamente en nuevos escenarios de la vida real. En una amplia revisión sistemática, casi la mitad de los algoritmos empleados en el diagnóstico por la imagen basados en la IA estudiados notificaron una disminución superior a 0,05 en el AUC cuando se probaron con datos nuevos. Yu et al., 2022). Esta falta de generalización puede tener efectos adversos en el rendimiento del modelo en la vida real.
Si una solución obtiene malos resultados al probarse con un conjunto de datos que tienen una distribución similar o idéntica a la del conjunto de datos de entrenamiento, se dice que carece de una generalización estrecha, a menudo, consecuencia de un sobreajuste (Eche et al., 2021). Las posibles soluciones para el sobreajuste consisten en utilizar conjuntos de datos de entrenamiento más grandes y reducir la complejidad del modelo. Si una solución obtiene malos resultados al probarse con un conjunto de datos que tienen una distribución diferente a la del conjunto de datos de entrenamiento (por ejemplo, una distribución diferente de las etnias de los pacientes), se dice que carece de una amplia generalización (Eche et al., 2021). Entre las soluciones para abordar esta falta de generalización amplia se incluyen las pruebas de estrés del modelo en conjuntos de datos con distribuciones diferentes a las del conjunto de datos de entrenamiento (Eche et al., 2021).
Es importante tener en cuenta que las soluciones de IA suelen desarrollarse en entornos con muchos recursos, como las grandes empresas tecnológicas y los centros médicos académicos de los países ricos. Sin embargo, es probable que los hallazgos y el rendimiento en estos contextos de altos recursos no se generalicen a contextos de menores recursos, como hospitales más pequeños, zonas rurales o países más pobres (Price y Nicholson, 2019), lo que complica aún más esta problemática.
Riesgo de sesgo
En las soluciones basadas en IA pueden surgir sesgos debidos a los datos o a factores humanos. Los primeros se producen cuando los datos utilizados para entrenar la solución de IA no representan adecuadamente a la población objetivo. Los conjuntos de datos pueden no ser representativos cuando son demasiado pequeños o se han recopilado de una manera que no representa a una determinada categoría de población. Las soluciones de IA entrenadas con datos no representativos perpetúan los sesgos y obtienen malos resultados en las categorías de población infrarrepresentadas o mal representadas en los datos de entrenamiento. La presencia de dichos sesgos se ha demostrado empíricamente en muchos estudios de diagnóstico por la imagen basados en la IA (Larrazábal et al., 2020; Seyyed-Kalantari et al., 2021).
Las soluciones basadas en inteligencia artificial pueden estar sujetas a decisiones subjetivas y, en ocasiones, a prejuicios implícitos o explícitos durante su desarrollo por parte de los seres humanos. Estos factores humanos incluyen cómo se seleccionan los datos de entrenamiento, cómo se etiquetan y cómo se toma la decisión de centrarse en el problema específico que la solución basada en IA pretende resolver (Norori et al., 2021). Existen algunas recomendaciones y herramientas para contribuir a minimizar el riesgo de sesgo en la investigación sobre IA (AIF360: A Comprehensive Set of Fairness Metrics for Datasets and Machine Learning Models, Explanations for These Metrics, and Algorithms to Mitigate Bias in Datasets and Models, s.f., IBM Watson Studio - Model Risk Management, s.f.; Silberg & Manyika, 2019).
Cantidad, calidad y variedad de datos
Problemas como el sesgo y la falta de generalización pueden mitigarse garantizando que los datos de entrenamiento sean de una cantidad, calidad y variedad suficientes. Sin embargo, esto se complica debido a que los pacientes suelen mostrar reticencia a compartir sus datos con fines comerciales (Aggarwal, Farag, et al., 2021; Ghafur et al., 2020; Trinidad et al., 2020). Además, los hospitales y las clínicas no suelen estar preparados para poner a disposición estos datos de una manera utilizable y segura, y la organización y etiquetado de los mismos requiere mucho tiempo y recursos.
Aunque existen múltiples conjuntos de datos que podrían utilizarse para diversos propósitos, el hecho de compartir datos entre empresas podría agilizar el proceso de recopilación y organización, así como aumentar la cantidad de datos disponibles para cada aplicación. Sin embargo, los desarrolladores suelen ser reacios a compartir datos entre sí, o incluso a revelar la fuente exacta de sus datos, para seguir siendo competitivos.
Protección de datos y privacidad
El desarrollo y la aplicación de soluciones basadas en la IA requieren que los pacientes estén explícitamente informados sobre el uso de sus datos para un fin concreto y por determinadas personas, y que den su consentimiento para ello. Estos datos también tienen que estar adecuadamente protegidos frente a filtraciones y usos indebidos. Si esto no se garantiza, se socava en gran medida la confianza de la población en las soluciones basadas en IA y dificulta su adopción. Si bien las regulaciones que rigen la privacidad de los datos de salud determinan que la recopilación de datos totalmente anonimizados no requiere el consentimiento explícito del paciente (Reglamento General de Protección de Datos(GDPR) – Texto Legal Oficial, 2016; Oficina de Derechos Civiles (OCR), 2012) y, en teoría, protege de un uso indebido de los datos, surge controversia en cuanto a si los datos utilizados en el diagnóstico por la imagen pueden o no ser completamente anonimizados (Lotan et al., 2020; Murdoch, 2021). También se debate si el consentimiento puede ser verdaderamente informado, considerando la complejidad de los datos que se adquieren y la multitud de posibles usos futuros de los mismos (Vayena y Blasimme, 2017).
Infraestructura de TI
Entre las unidades hospitalarias, la unidad de radiología ha sido pionera en la adopción de la digitalización. Es probable que las soluciones basadas en la IA que se centran en el procesamiento e interpretación de imágenes encuentren la infraestructura necesaria en la mayoría de las unidades de radiología, por ejemplo, para conectar equipos de imagen a computadoras para su análisis, y para archivar imágenes y otros resultados. Sin embargo, es probable que la mayoría de las unidades de radiología necesiten realizar mejoras significativas en su infraestructura para poder utilizar otras aplicaciones de IA, especialmente las que implican la integración de información de múltiples fuentes y producen resultados complejos. Además, es importante tener en cuenta que la distribución de las infraestructuras necesarias es muy desigual entre los países y dentro de ellos (Health Ethics & Governance, 2021).
En términos de potencia informática, las unidades de radiología tendrán que invertir recursos en el hardware y el personal necesarios para ejecutar estas soluciones basadas en IA u optar por soluciones basadas en la nube. El primero tiene un coste adicional, pero permite procesar los datos dentro de los límites de la red local del hospital o clínica. Las soluciones informáticas basadas en la nube (conocidas como «infraestructura como servicio» o «IaaS») suelen considerarse la opción menos segura y menos fiable, pero esto depende de varios factores y, por tanto, no siempre es cierto (Baccianella & Gough, s.f.). Existen directrices sobre los aspectos que hay que tener en cuenta a la hora de adquirir soluciones basadas en la nube en el sector sanitario (Seguridad en la nube para servicios sanitarios, 2021).
Falta de estandarización, interoperabilidad e integrabilidad
El problema de la infraestructura se complica aún más si se tiene en cuenta lo fragmentado que está actualmente el mercado del diagnóstico por la imagen basado en la IA (Alexander et al., 2020). Por tanto, es probable que en un futuro próximo, una sola unidad cuente con varias docenas de soluciones basadas en IA, procedentes de distintos proveedores funcionando simultáneamente. Disponer de una infraestructura independiente y autónoma (por ejemplo, una estación de trabajo o un servidor) para cada una de ellas sería increíblemente complicado y difícil de gestionar. Las soluciones sugeridas para ello incluyen «mercados» de soluciones de IA, similares a las tiendas de aplicaciones (Advanced AI Solutions for Radiology, n.d., Curated Marketplace, 2018, Imaging AI Marketplace - Overview, n.d., Sectra Amplifier Marketplace, 2021, The Nuance AI Marketplace for Diagnostic Imaging, n.d.), and development of an overarching vendor-neutral infrastructure (Leiner et al., 2021). Para implantar con éxito este tipo de soluciones, es necesaria una estrecha colaboración entre los desarrolladores de soluciones de IA, los proveedores de tratamiento de imágenes y las empresas de tecnologías de la información.
Interpretabilidad
A menudo es imposible entender exactamente cómo las soluciones basadas en IA llegan a sus conclusiones, especialmente con enfoques complejos como el aprendizaje profundo. La falta de transparencia en el proceso de toma de decisiones para adquirir y aprobar soluciones basadas en inteligencia artificial dificulta la identificación de sesgos y complica la tarea de los médicos al explicar los resultados a sus pacientes. Además, determinar si una solución funciona correctamente o ha fallado se vuelve más desafiante (Char et al., 2018; Reddy et al., 2020; Vayena et al., 2018; Whittlestone et al., 2019). Algunos expertos sugieren que las técnicas que ayudan a los seres humanos a entender cómo los algoritmos basados en IA toman ciertas decisiones o predicciones (IA «interpretable» o «explicable») podrían ayudar a mitigar estos retos. Sin embargo, otros argumentan que las técnicas actuales no son suficientes para comprender las decisiones individuales de un algoritmo y advierten contra la confianza ciega en ellas para garantizar la seguridad y fiabilidad de los algoritmos (Ghassemi et al., 2021).
Responsabilidad
En los sistemas sanitarios, un marco de rendición de cuentas garantiza que el personal sanitario y las instituciones médicas puedan ser considerados responsables de los efectos adversos derivados de sus acciones. La cuestión de quién debe ser considerado responsable por los fallos de una solución basada en la IA es compleja. En el caso de los productos farmacéuticos, por ejemplo, la responsabilidad por los fallos inherentes al producto o a su uso suele recaer en el fabricante o en el prescriptor. Una diferencia clave es que los sistemas basados en IA evolucionan y aprenden continuamente, por lo que intrínsecamente funcionan de una manera independiente de lo que sus desarrolladores podrían haber previsto (Yeung, 2018). Para el usuario final, como el trabajador sanitario, la solución basada en IA puede ser opaca y, por tanto, no podrá saber cuándo la solución funciona mal o es imprecisa (Habli et al., 2020; Yeung, 2018).
Fragilidad
A pesar de los avances significativos en su desarrollo durante los últimos años, los algoritmos de aprendizaje profundo siguen siendo sorprendentemente frágiles. Esto implica que cuando el algoritmo se encuentra con una situación significativamente diferente a la que enfrentó durante su entrenamiento, no puede contextualizar adecuadamente y, en muchos casos, produce resultados incoherentes o incorrectos. Esto ocurre porque, a diferencia de los seres humanos, la mayoría de los algoritmos aprenden a percibir las cosas dentro de los límites de ciertos supuestos, pero no consiguen generalizar fuera de ellos. Como ejemplo de cómo se puede abusar de esto con intenciones maliciosas, los cambios sutiles en las imágenes médicas, imperceptibles para los seres humanos, pueden provocar que los resultados de los algoritmos de clasificación de enfermedades sean inexactos (Finlayson et al., 2018). La falta de interpretabilidad de muchas soluciones basadas en la IA agrava este problema, ya que dificulta la resolución de problemas sobre cómo han llegado a una conclusión errónea.
Toma de decisiones sobre la adquisición
Hasta ahora, más de 100 productos basados en IA han obtenido la marca de conformidad europea (CE) o la autorización de la Administración de Alimentos y Medicamentos (FDA) de los EE. UU. Estos productos se pueden encontrar en bases de datos en línea continuamente actualizadas y con capacidad de búsqueda seleccionadas por la FDA (Center for Devices & Radiological Health, n.d.), el Colegio Estadounidense de Radiología (Assess-AI, s.f.), y otros (AI for Radiology, s.f., The Medical Futurist, n.d.; E. Wu et al., 2021). El creciente número de productos disponibles, la complejidad inherente a muchas de estas soluciones y el hecho de que muchas de las personas que suelen tomar las decisiones de compra en los hospitales no estén familiarizadas con la evaluación de este tipo de productos, hacen que sea importante pensar detenidamente a la hora de decidir qué producto adquirir. Tales decisiones deberán tomarse tras incorporar las aportaciones del personal sanitario, los profesionales de las tecnologías de la información (TI) y los profesionales de la gestión, las finanzas, la legislación y los recursos humanos de los hospitales.
Decidir si adquirir una solución basada en IA en radiología, así como cuál de las cada vez más numerosas soluciones disponibles en el mercado, incluye consideraciones de calidad, seguridad y económicas. En los últimos años, han surgido varias directrices para ayudar a los compradores potenciales a tomar estas decisiones (A Buyer's Guide to AI in Health and Care, 2020; Omoumi et al., 2021; Reddy et al., 2021), y es probable que estas directrices evolucionen en el futuro con las expectativas cambiantes de los clientes, los organismos reguladores y las partes interesadas que participan en las decisiones de reembolso.
En primer lugar, el comprador potencial debe tener claro cuál es el problema y si la IA es la solución adecuada o si existen alternativas más ventajosas. Si la IA es el enfoque adecuado, los compradores deben saber exactamente cuál es el alcance de la solución de un posible producto basado en IA, es decir, para qué problema concreto está diseñada la solución basada en IA y en qué circunstancias específicas. Esto incluye si la solución está destinada a la detección, el diagnóstico, el seguimiento, la recomendación de tratamiento u otra aplicación. También incluye a los usuarios previstos de la solución, y qué tipo de cualificaciones o formación específicas se espera que tengan para poder manejar la solución e interpretar sus resultados. Los compradores deben tener claro si la solución pretende sustituir determinadas tareas que normalmente realizaría el usuario final, actuar como doble evaluador, como mecanismo de triaje o para otras tareas como el control de calidad. Los compradores también deben saber si la solución pretende proporcionar información «nueva» (es decir, información que de otro modo no estaría disponible para el usuario sin la solución), mejorar el rendimiento de una tarea existente más allá del rendimiento de un ser humano o de otra solución no basada en la IA, o si pretende ahorrar tiempo u otros recursos.
Los compradores también deben tener acceso a información que les permita evaluar los beneficios potenciales de la solución de IA, y esto debe estar avalado por pruebas científicas publicadas sobre la eficacia y la rentabilidad de la solución. La forma de hacerlo dependerá en gran medida de la propia solución y del contexto en el que se prevea desplegarla, pero existen directrices al respecto (National Institute for Health and Care Excellence [NICE], s.f.). Algunas preguntas que cabría hacerse son: ¿Qué influencia tendrá la solución en la gestión de los pacientes?
¿Mejorará el rendimiento diagnóstico? ¿Ahorrará tiempo y dinero? ¿Afectará la calidad de vida de los pacientes? También debe quedar claro para el comprador quién exactamente se espera que se beneficie del uso de esta solución (¿radiólogos? ¿médicos? ¿pacientes? ¿El sistema sanitario o la sociedad en su conjunto?).
Como ocurre con cualquier intervención sanitaria, todas las soluciones basadas en la IA conllevan ciertos riesgos, que el comprador debe tener claros. Algunos de estos riesgos pueden tener consecuencias jurídicas, como la posibilidad de que se elabore un diagnóstico erróneo. Estos riesgos deben cuantificarse, y los posibles compradores deben disponer de un marco para afrontarlos, incluida la identificación de un marco de responsabilidad dentro de las organizaciones que utilizan estas aplicaciones. Los compradores también deben asegurarse de que entienden claramente los posibles efectos negativos en la formación de los radiólogos y la posible interrupción de los flujos de trabajo de los radiólogos asociados al uso de estas soluciones.
Los aspectos específicos del diseño de la solución de IA también son relevantes a la hora de decidir si adquirirla o no. Entre ellos se incluyen la solidez de la solución frente a las diferencias entre proveedores y parámetros de escaneado, las circunstancias en las que se entrenó el algoritmo (incluidos los posibles factores de confusión) y la forma en que se evaluó el rendimiento. También debe quedar claro para los compradores si se tuvieron en cuenta las posibles fuentes de sesgo durante el desarrollo y de qué manera. Dado que una característica fundamental de las soluciones basadas en IA es su capacidad para aprender continuamente a partir de nuevos datos, el comprador también debe tener claro si esta actualización se incorpora a la solución a lo largo del tiempo y, en caso afirmativo, cómo se hace, y si es necesaria o no una nueva aprobación reglamentaria con cada iteración. Esto incluye también si es necesario o no un reciclaje, por ejemplo, debido a cambios en los equipos de diagnóstico por la imagen de la institución del comprador.
Los principales argumentos de venta en los que se basan muchas soluciones basadas en IA son la facilidad de uso y la mejora de los flujos de trabajo. Por lo tanto, los posibles compradores deben examinar detenidamente cómo se van a integrar estas soluciones en los flujos de trabajo existentes, incluida la interoperabilidad con los sistemas de comunicación y almacenamiento de imágenes, y de historia clínica electrónica. El hecho de que la solución requiera o no hardware (por ejemplo, unidades de procesamiento gráfico) o software adicionales (por ejemplo, para la visualización de los resultados de la solución), o si puede integrarse fácilmente en la infraestructura informática existente de la organización del comprador, influye en el coste global de la solución para el comprador y, por lo tanto, también es un aspecto crítico a tener en cuenta. Además, el comprador debe conocer el grado de interacción manual necesario, tanto en circunstancias normales como para resolver problemas. Todos los usuarios potenciales de la solución de IA deben participar en el proceso de compra para garantizar que estén familiarizados con ella, que cumpla con los estándares éticos profesionales y se adapte a sus necesidades.
Desde el punto de vista normativo, el comprador debe tener claro si la solución cumple la normativa sobre productos sanitarios y protección de datos. ¿La solución ha sido aprobada en el país del comprador? Si es así, ¿bajo qué clasificación de riesgo? Los compradores también deben considerar la creación de mapas de flujo de datos que muestren cómo fluyen los datos en el funcionamiento de la solución basada en IA, incluyendo quién tiene acceso a los datos.
Por último, hay otros factores a tener en cuenta que no son necesariamente exclusivos de las soluciones basadas en IA y con los que los compradores podrían estar familiarizados por haber adquirido otros tipos de soluciones. Por ejemplo, el modelo de licencia de la solución, cómo se formará a los usuarios para que utilicen la solución, cómo se mantendrá la solución, cómo se tratarán los fallos de la solución, y si habrá costes adicionales cuando se amplíe la aplicación de la solución (por ejemplo, si se utiliza la solución para más equipos de tratamiento de imágenes o más usuarios). Esto permite al posible comprador anticipar los costes actuales y futuros de la adquisición de la solución.
Futuras tendencias
En la última década, el creciente interés y progreso en las soluciones basadas en inteligencia artificial en el diagnóstico por la imagen han sentado las bases para una serie de tendencias que probablemente surgirán o se intensificarán en un futuro cercano.
En primer lugar, cada vez es más habitual la opinión de que, aunque la IA muestra un gran potencial en aplicaciones interpretativas (como la detección de patologías), las soluciones no interpretativas basadas en IA podrían ser las que aporten una mayor eficiencia los flujos de trabajo radiológicos y mejoren la experiencia de los pacientes. Es probable que esta tendencia de involucrar a la IA en una fase más temprana del proceso de manejo del paciente se extienda a una IA que actúe cada vez más como un sistema complementario para la toma de decisiones clínicas, orientando cuándo y qué exploraciones de imagen se deben realizar.
Para que esto suceda, la IA debe integrarse en los sistemas de información clínica existentes, y los algoritmos específicos utilizados deben poder manejar datos más variados. Es probable que esto allane el camino para el desarrollo de algoritmos que sean capaces de integrar datos demográficos, clínicos y de laboratorio de los pacientes, con el fin de elaborar recomendaciones sobre el manejo de los pacientes (Huang, Pareek, et al., 2020; Rockenbach, 2021). Los algoritmos de procesamiento del lenguaje natural mencionados anteriormente, que se han utilizado para interpretar las solicitudes de pruebas, pueden ser candidatos útiles para ello.
Además, es probable que veamos algoritmos de IA capaces de interpretar varios tipos distintos de datos de imagen de un mismo paciente. En la actualidad, menos del 5 % de las soluciones basadas en IA disponibles comercialmente en el ámbito del diagnóstico por la imagen utilizan más de una modalidad de imagen (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021), a pesar de que el paciente típico hospitalario se somete a múltiples exploraciones durante su ingreso (Shinagare et al., 2014). Con ello, también es probable que se desarrollen más soluciones basadas en la IA dirigidas a modalidades hasta ahora desatendidas, como las técnicas de imagen nuclear y las ecografías.
El mercado actual de soluciones de radiología basadas en IA se distribuye entre un número relativamente grande de empresas (Alexander et al., 2020). Es probable que los posibles usuarios potenciales esperen una integración simplificada de estos productos en sus flujos de trabajo, lo que puede resultar difícil en un mercado tan fragmentado. La mejora de la integración puede lograrse de varias maneras, por ejemplo con mercados de proveedores neutrales o mediante la consolidación gradual de los proveedores de soluciones basadas en IA.
Con la expansión del uso de la IA, la cuestión de la confianza entre los desarrolladores de IA, los profesionales sanitarios, los reguladores y los pacientes será cada vez más importante. Por tanto, es probable que se intensifiquen los esfuerzos para tomar medidas que refuercen esa confianza. Esto incluirá potencialmente elevar los estándares de evidencia esperados para las soluciones basadas en IA (Aggarwal, Sounderajah, et al., 2021; X. Liu et al., 2019; van Leeuwen et al., 2021; Yusuf et al., 2020), haciéndolos más transparentes mediante el uso y la mejora de técnicas de IA interpretables (Holzinger et al., 2017; Reyes et al., 2020; “Towards Trustable Machine Learning”, 2018), y mejorando las técnicas para mantener la privacidad de los datos de los pacientes (G. Kaissis et al., 2021; G. A. Kaissis et al., 2020).
Además, aunque la mayoría de las normativas vigentes estipulan que los algoritmos basados en IA no pueden modificarse tras la aprobación reglamentaria, es probable que esto cambie en el futuro. El potencial de estos algoritmos para aprender de los datos adquiridos tras la aprobación y adaptarse a las circunstancias cambiantes es una gran ventaja de la IA. Sin embargo, el sector sanitario carece hasta ahora de marcos para hacerlo. Sin embargo, recientemente han surgido ideas prometedoras, como la adaptación de los marcos existentes de garantía y mejora de la calidad hospitalaria para supervisar el rendimiento de los algoritmos basados en IA y los datos con los que se entrenan y actualizan los algoritmos en consecuencia (Feng et al., 2022). Esto probablemente requerirá el desarrollo de equipos multidisciplinarios dentro de los hospitales, compuestos por médicos, profesionales de TI y bioestadísticos, que colaboren estrechamente con los desarrolladores y reguladores de modelos (Feng et al., 2022).
Si bien los obstáculos comentados en las secciones anteriores podrían ralentizar un poco la adopción de la IA en radiología, es poco probable que el miedo a que la IA sustituya potencialmente a los radiólogos sea uno de ellos. Una encuesta reciente realizada en Europa mostró que la mayoría de los radiólogos no percibían una reducción de su carga de trabajo clínico tras adoptar soluciones basadas en IA (Sociedad Europea de Radiología [ESR], 2022), probablemente porque, al mismo tiempo, la demanda de servicios radiológicos no ha dejado de aumentar. Estudios realizados en todo el mundo han demostrado que los profesionales de la radiología, en particular aquellos con experiencia y exposición a la IA, se muestran en general optimistas sobre el papel de la IA en su práctica (Y. Chen et al., 2021; Huisman et al., 2021; Ooi et al., 2021; Santomartino & Yi, 2022; Scott et al., 2021).
Conclusión
La IA ha demostrado ser prometedora para influir positivamente en prácticamente todas las facetas del trabajo de una unidad de radiología. Desde la programación y el protocolo de exploraciones de pacientes hasta la interpretación de imágenes y diagnósticos, la IA ha mostrado su valía. Sin embargo, a pesar de las investigaciones prometedoras sobre herramientas basadas en IA en radiología, su adopción en la práctica habitual aún no es generalizada. Esto se debe a una serie de cuestiones complejas y parcialmente relacionadas entre sí. Aunque existen posibles soluciones para muchos de estos desafíos, muchas de ellas requieren mayor perfeccionamiento y pruebas. Mientras tanto, están surgiendo directrices para ayudar a los posibles usuarios de soluciones basadas en IA en radiología a navegar por el creciente número de productos comerciales. Esto fomenta su adopción en situaciones de la vida real, lo que permite descubrir su verdadero potencial, así como identificar y abordar sus puntos débiles de forma segura y eficaz. A medida que se introduzcan estas mejoras graduales, es probable que estas herramientas evolucionen para manejar datos más variados, se integren en flujos de trabajo consolidados, sean más transparentes y, en última instancia, más útiles para aumentar la eficiencia y mejorar la atención al paciente.
Referencias bibliográficas
AAMC Report Reinforces Mounting Physician Shortage. (2021). AAMC. https://www.aamc.org/news-insights/press- releases/aamc-report-reinforces-mounting-physician-shortage
A buyer’s guide to AI in health and care. (2020). NHS Transformation Directorate. https://www.nhsx.nhs.uk/ai-lab/ explore-all-resources/adopt-ai/a-buyers-guide-to-ai-in-health- and-care/
Advanced AI solutions for radiology. (n.d.). Calantic Website. Retrieved July 3, 2022, from https://aivisions.calantic.com/
Aggarwal, R., Farag, S., Martin, G., Ashrafian, H., & Darzi, A. (2021). Patient Perceptions on Data Sharing and Applying Artificial Intelligence to Health Care Data: Cross-sectional Survey. Journal of Medical Internet Research, 23(8), e26162. https://doi.org/10.2196/26162
Aggarwal, R., Sounderajah, V., Martin, G., Ting, D. S. W., Karthikesalingam, A., King, D., Ashrafian, H., & Darzi, A. (2021). Diagnostic accuracy of deep learning in medical imaging: a systematic review and meta-analysis. NPJ Digital Medicine, 4(1), 65. https://doi.org/10.1038/s41746-021-00438-z
Agnes, S. A., Anitha, J., Pandian, S. I. A., & Peter, J. D. (2019). Classification of Mammogram Images Using Multiscale all Convolutional Neural Network (MA-CNN). Journal of Medical Systems, 44(1), 30. https://doi.org/10.1007/s10916-019-1494-z
AIF360: A comprehensive set of fairness metrics for datasets and machine learning models, explanations for these metrics, and algorithms to mitigate bias in datasets and models. (n.d.). Github. Retrieved June 11, 2022, from https:// github.com/Trusted-AI/AIF360
AI for radiology. (n.d.). Retrieved June 26, 2022, from https://grand-challenge.org/aiforradiology/?subspeciality=Abdomen&modality=All&ce_ under=All&ce_class=All&fda_class=All&sort_by=last %20 modified&search=
Akagi, M., Nakamura, Y., Higaki, T., Narita, K., Honda, Y., Zhou, J., Yu, Z., Akino, N., & Awai, K. (2019). Deep learning reconstruction improves image quality of abdominal ultra- high-resolution CT. European Radiology, 29(11), 6163–6171. https://doi.org/10.1007/s00330-019-06170-3
Akkus, Z., Cai, J., Boonrod, A., Zeinoddini, A., Weston, A. D., Philbrick, K. A., & Erickson, B. J. (2019). A Survey of Deep- Learning Applications in Ultrasound: Artificial Intelligence- Powered Ultrasound for Improving Clinical Workflow. Journal of the American College of Radiology: JACR, 16(9 Pt B), 1318–1328. https://doi.org/10.1016/j.jacr.2019.06.004
Al-Antari, M. A., Al-Masni, M. A., & Kim, T.-S. (2020). Deep Learning Computer-Aided Diagnosis for Breast Lesion in Digital Mammogram. Advances in Experimental Medicine and Biology, 1213, 59–72. https://doi.org/10.1007/978-3-030-33128-3_4
Alexander, A., Jiang, A., Ferreira, C., & Zurkiya, D. (2020). An Intelligent Future for Medical Imaging: A Market Outlook on Artificial Intelligence for Medical Imaging. Journal of the American College of Radiology: JACR, 17(1 Pt B), 165–170. https:// doi.org/10.1016/j.jacr.2019.07.019
Allen, B., Agarwal, S., Coombs, L., Wald, C., & Dreyer, K. (2021). 2020 ACR Data Science Institute Artificial Intelligence Journal of the American College of Radiology: JACR
Alzubaidi, L., Zhang, J., Humaidi, A. J., Al-Dujaili, A., Duan, Y., Al-Shamma, O., Santamaría, J., Fadhel, M. A., Al-Amidie, M., & Farhan, L. (2021). Review of deep learning: concepts, CNN architectures, challenges, applications, future directions.
Arbabshirani, M. R., Fornwalt, B. K., Mongelluzzo, G. J., Suever, J. D., Geise, B. D., Patel, A. A., & Moore, G. J. (2018). Advanced machine learning in action: identification of intracranial hemorrhage on computed tomography scans of the head with clinical workflow integration. NPJ Digital Medicine, 1, 9. https://doi.org/10.1038/s41746-017-0015-z
Ardila, D., Kiraly, A. P., Bharadwaj, S., Choi, B., Reicher, J. J., Peng, L., Tse, D., Etemadi, M., Ye, W., Corrado, G., Naidich, D. P., & Shetty, S. (2019). End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography. Nature Medicine, 25(6), 954–961. https://doi. org/10.1038/s41591-019-0447-x
Arefan, D., Mohamed, A. A., Berg, W. A., Zuley, M. L., Sumkin, J. H., & Wu, S. (2020). Deep learning modeling using normal mammograms for predicting breast cancer risk. Medical Physics, 47(1), 110–118. https://doi.org/10.1002/mp.13886
Assess-AI. (n.d.). Retrieved July 2, 2022, from https://www. acrdsi.org/DSI-Services/Assess-AI
Azer, S. A. (2019). Deep learning with convolutional neural networks for identification of liver masses and hepatocellular carcinoma: A systematic review. World Journal of Gastrointestinal Oncology, 11(12), 1218–1230. https://doi.org/10.4251/wjgo.v11. i12.1218
Bacchi, S., Zerner, T., Oakden-Rayner, L., Kleinig, T., Patel, S., & Jannes, J. (2020). Deep Learning in the Prediction of Ischaemic Stroke Thrombolysis Functional Outcomes: A Pilot Study. Academic Radiology, 27(2), e19–e23. https://doi. org/10.1016/j.acra.2019.03.015
Baccianella, S., & Gough, T. (n.d.). Why cloud computing is the best option for hospitals adopting AI. Retrieved June 11, 2022, from https://www.aidence.com/articles/cloud-best-option- imaging-ai/
Balint, B. J., Steenburg, S. D., Lin, H., Shen, C., Steele, J. L., & Gunderman, R. B. (2014). Do telephone call interruptions have an impact on radiology resident diagnostic accuracy? Academic Radiology, 21(12), 1623–1628. https://doi.org/10.1016/j. acra.2014.08.001
Baltruschat, I., Steinmeister, L., Nickisch, H., Saalbach, A., Grass, M., Adam, G., Knopp, T., & Ittrich, H. (2021). Smart chest X-ray worklist prioritization using artificial intelligence: a clinical workflow simulation. European Radiology, 31(6), 3837– 3845. https://doi.org/10.1007/s00330-020-07480-7
Bash, S., Johnson, B., Gibbs, W., Zhang, T., Shankaranarayanan, A., & Tanenbaum, L. N. (2021). Deep Learning Image Processing Enables 40 % Faster Spinal MR Scans Which Match or Exceed Quality of Standard of Care : A Prospective Multicenter Multireader Study. Clinical Neuroradiology. https://doi.org/10.1007/s00062-021-01121-2
Bash, S., Wang, L., Airriess, C., Zaharchuk, G., Gong, E., Shankaranarayanan, A., & Tanenbaum, L. N. (2021). Deep Learning Enables 60 % Accelerated Volumetric Brain MRI While Preserving Quantitative Performance: A Prospective, Multicenter, Multireader Trial. AJNR. American Journal of Neuroradiology, 42(12), 2130–2137. https://doi.org/10.3174/ajnr.A7358
Boas, F. E., & Fleischmann, D. (2012). CT artifacts: causes and reduction techniques. Imaging in Medicine, 4(2), 229–240. https://doi.org/10.2217/iim.12.13
Boland, G. W., Duszak, R., Jr, & Kalra, M. (2014). Protocol design and optimization. Journal of the American College of Radiology: JACR, 11(5), 440–441. https://doi.org/10.1016/j. jacr.2014.01.021
Bonavita, I., Rafael-Palou, X., Ceresa, M., Piella, G., Ribas, V., & González Ballester, M. A. (2020). Integration of convolutional neural networks for pulmonary nodule malignancy assessment in a lung cancer classification pipeline. Computer Methods and Programs in Biomedicine, 185, 105172. https://doi.org/10.1016/j.cmpb.2019.105172
Bozkurt, S., Cahan, E. M., Seneviratne, M. G., Sun, R., Lossio- Ventura, J. A., Ioannidis, J. P. A., & Hernandez-Boussard, T. (2020). Reporting of demographic data and representativeness in machine learning models using electronic health records.
Journal of the American Medical Informatics Association: JAMIA, 27(12), 1878–1884. https://doi.org/10.1093/jamia/ocaa164
Brown, A. D., & Marotta, T. R. (2018). Using machine learning for sequence-level automated MRI protocol selection in neuroradiology. Journal of the American Medical Informatics Association: JAMIA, 25(5), 568–571. https://doi.org/10.1093/ jamia/ocx125
Bruls, R. J. M., & Kwee, R. M. (2020). Workload for radiologists during on-call hours: dramatic increase in the past 15 years.
Insights into Imaging, 11(1), 121. https://doi.org/10.1186/ s13244-020-00925-z
Buruk, B., Ekmekci, P. E., & Arda, B. (2020). A critical perspective on guidelines for responsible and trustworthy artificial intelligence. Medicine, Health Care, and Philosophy, 23(3), 387–399. https://doi.org/10.1007/s11019-020-09948-1
Cadario, R., Longoni, C., & Morewedge, C. K. (2021). Understanding, explaining, and utilizing medical artificial intelligence. Nature Human Behaviour, 5(12), 1636–1642. https://doi.org/10.1038/s41562-021-01146-0
Center for Devices, & Radiological Health. (n.d.). Artificial Intelligence and Machine Learning (AI/ML)-Enabled Medical Devices. U.S. Food and Drug Administration; FDA. Retrieved July 2, 2022, from https://www.fda.gov/medical-devices/software- medical-device-samd/artificial-intelligence-and-machine- learning-aiml-enabled-medical-devices
Char, D. S., Shah, N. H., & Magnus, D. (2018). Implementing Machine Learning in Health Care - Addressing Ethical Challenges. The New England Journal of Medicine, 378(11), 981–983. https://doi.org/10.1056/NEJMp1714229
Chen, H., Zhang, Y., Kalra, M. K., Lin, F., Chen, Y., Liao, P., Zhou, J., & Wang, G. (2017). Low-Dose CT With a Residual Encoder-Decoder Convolutional Neural Network. IEEE Transactions on Medical Imaging, 36(12), 2524–2535. https://doi.org/10.1109/TMI.2017.2715284
Chen, Y., Stavropoulou, C., Narasinkan, R., Baker, A., & Scarbrough, H. (2021). Professionals’ responses to the introduction of AI innovations in radiology and their implications for future adoption: a qualitative study. BMC Health Services Research, 21(1), 813. https://doi.org/10.1186/ s12913-021-06861-y
Choe, J., Lee, S. M., Do, K.-H., Lee, G., Lee, J.-G., Lee, S. M., & Seo, J. B. (2019). Deep Learning-based Image Conversion of CT Reconstruction Kernels Improves Radiomics Reproducibility for Pulmonary Nodules or Masses. Radiology, 292(2), 365–373. https://doi.org/10.1148/radiol.2019181960
Choi, K. S., Choi, S. H., & Jeong, B. (2019). Prediction of IDH genotype in gliomas with dynamic susceptibility contrast perfusion MR imaging using an explainable recurrent neural network. Neuro-Oncology, 21(9), 1197–1209. https://doi.org/10.1093/neuonc/noz095
Chong, L. R., Tsai, K. T., Lee, L. L., Foo, S. G., & Chang, P. C. (2020). Artificial Intelligence Predictive Analytics in the Management of Outpatient MRI Appointment No-Shows. AJR. American Journal of Roentgenology, 215(5), 1155–1162. https://doi.org/10.2214/AJR.19.22594
Cikes, M., Sanchez-Martinez, S., Claggett, B., Duchateau, N., Piella, G., Butakoff, C., Pouleur, A. C., Knappe, D., Biering- Sørensen, T., Kutyifa, V., Moss, A., Stein, K., Solomon, S. D., & Bijnens, B. (2019). Machine learning-based phenogrouping in heart failure to identify responders to cardiac resynchronization therapy. European Journal of Heart Failure, 21(1), 74–85. https://doi.org/10.1002/ejhf.1333
Ciompi, F., Chung, K., van Riel, S. J., Setio, A. A. A., Gerke, P. K., Jacobs, C., Scholten, E. T., Schaefer-Prokop, C., Wille,
M. M. W., Marchianò, A., Pastorino, U., Prokop, M., & van Ginneken, B. (2017). Towards automatic pulmonary nodule management in lung cancer screening with deep learning. Scientific Reports, 7, 46479. https://doi.org/10.1038/srep46479
Clinical radiology UK workforce census 2019 report. (2019). https://www.rcr.ac.uk/publication/clinical-radiology-uk- workforce-census-2019-report
Cloud security for healthcare services. (2021, January 14). ENISA. https://www.enisa.europa.eu/publications/cloud- security-for-healthcare-services/
CONSORT-AI and SPIRIT-AI Steering Group. (2019). Reporting guidelines for clinical trials evaluating artificial intelligence interventions are needed. Nature Medicine, 25(10), 1467–1468. https://doi.org/10.1038/s41591-019-0603-3
Curated marketplace. (2018, May 22). Blackford. https://www.blackfordanalysis.com/applications/
Dance, A. (2021). AI spots cell structures that humans can’t. Nature. 592 (7852), 154–155.
Dantas, L. F., Fleck, J. L., Cyrino Oliveira, F. L., & Hamacher, S. (2018). No-shows in appointment scheduling - a systematic literature review. Health Policy, 122(4), 412–421. https://doi.org/10.1016/j.healthpol.2018.02.002
Deák, Z., Grimm, J. M., Treitl, M., Geyer, L. L., Linsenmaier, U., Körner, M., Reiser, M. F., & Wirth, S. (2013). Filtered back projection, adaptive statistical iterative reconstruction, and a model-based iterative reconstruction in abdominal CT: an experimental clinical study. Radiology, 266(1), 197–206. https://doi.org/10.1148/radiol.12112707
Dembrower, K., Liu, Y., Azizpour, H., Eklund, M., Smith, K., Lindholm, P., & Strand, F. (2020). Comparison of a Deep
Learning Risk Score and Standard Mammographic Density Score for Breast Cancer Risk Prediction. Radiology, 294(2), 265–272. https://doi.org/10.1148/radiol.2019190872
Do, B. H., Langlotz, C., & Beaulieu, C. F. (2017). Bone Tumor Diagnosis Using a Naïve Bayesian Model of Demographic and Radiographic Features. Journal of Digital Imaging, 30(5), 640–647. https://doi.org/10.1007/s10278-017-0001-7
Dou, Q., Yu, L., Chen, H., Jin, Y., Yang, X., Qin, J., & Heng, P.-A. (2017). 3D deeply supervised network for automated segmentation of volumetric medical images. Medical Image Analysis, 41, 40–54. https://doi.org/10.1016/j. media.2017.05.001
Eche, T., Schwartz, L. H., Mokrane, F.-Z., & Dercle, L. (2021). Toward Generalizability in the Deployment of Artificial Intelligence in Radiology: Role of Computation Stress Testing to Overcome Underspecification. Radiology. Artificial Intelligence, 3(6), e210097. https://doi.org/10.1148/ryai.2021210097
England, N. H. S., & Improvement, N. H. S. (2019). NHS diagnostic waiting times and activity data. NHS. https://www. england.nhs.uk/statistics/wp-content/uploads/sites/2/2021/12/ DWTA-Report-October-2021_M43D4.pdf
Esmaeilzadeh, P. (2020). Use of AI-based tools for healthcare purposes: a survey study from consumers’ perspectives. BMC Medical Informatics and Decision Making, 20(1), 170. https://doi. org/10.1186/s12911-020-01191-1
Esses, S. J., Lu, X., Zhao, T., Shanbhogue, K., Dane, B., Bruno, M., & Chandarana, H. (2018). Automated image quality evaluation of T2 -weighted liver MRI utilizing deep learning architecture. Journal of Magnetic Resonance Imaging: JMRI, 47(3), 723–728. https://doi.org/10.1002/jmri.25779
European Society of Radiology (ESR). (2022). Current practical experience with artificial intelligence in clinical radiology:
a survey of the European Society of Radiology. Insights into Imaging, 13(1), 107. https://doi.org/10.1186/s13244-022- 01247-y
Faron, A., Sichtermann, T., Teichert, N., Luetkens, J. A., Keulers, A., Nikoubashman, O., Freiherr, J., Mpotsaris, A., & Wiesmann, M. (2020). Performance of a Deep-Learning Neural Network to Detect Intracranial Aneurysms from 3D TOF-MRA Compared to Human Readers. Clinical Neuroradiology, 30(3), 591–598. https://doi.org/10.1007/s00062-019-00809-w
Feng, J., Phillips, R. V., Malenica, I., Bishara, A., Hubbard, A. E., Celi, L. A., & Pirracchio, R. (2022). Clinical artificial intelligence quality improvement: towards continual monitoring and updating of AI algorithms in healthcare. NPJ Digital Medicine, 5(1), 66. https://doi.org/10.1038/s41746-022- 00611-y
Finlayson, S. G., Chung, H. W., Kohane, I. S., & Beam, A. L. (2018). Adversarial Attacks Against Medical Deep Learning Systems. In arXiv [cs.CR]. arXiv. https://doi.org/10.1145/nnnnnnn. nnnnnnn
Flanders, A. E., Prevedello, L. M., Shih, G., Halabi, S. S., Kalpathy-Cramer, J., Ball, R., Mongan, J. T., Stein, A., Kitamura, F. C., Lungren, M. P., Choudhary, G., Cala, L., Coelho, L., Mogensen, M., Morón, F., Miller, E., Ikuta, I., Zohrabian, V., McDonnell, O., … RSNA-ASNR 2019 Brain Hemorrhage CT Annotators. (2020). Construction of a Machine Learning Dataset through Collaboration: The RSNA 2019 Brain CT Hemorrhage Challenge. Radiology. Artificial Intelligence, 2(3), e190211. https://doi.org/10.1148/ryai.2020190211
Freeman, K., Geppert, J., Stinton, C., Todkill, D., Johnson, S., Clarke, A., & Taylor-Phillips, S. (2021). Use of artificial intelligence for image analysis in breast cancer screening programmes: systematic review of test accuracy. BMJ , 374, n1872. https://doi.org/10.1136/bmj.n1872
General Data Protection Regulation (GDPR) – Official Legal Text. (2016, July 13). General Data Protection Regulation (GDPR). https://gdpr-info.eu/
Ghafur, S., Van Dael, J., Leis, M., Darzi, A., & Sheikh, A. (2020). Public perceptions on data sharing: key insights from the UK and the USA. The Lancet. Digital Health, 2(9), e444–e446. https://doi.org/10.1016/S2589-7500(20)30161-8
Ghani, M. U., & Clem Karl, W. (2019). Fast Enhanced CT Metal Artifact Reduction using Data Domain Deep Learning. In arXiv [cs.CV]. arXiv. http://arxiv.org/abs/1904.04691
Ghassemi, M., Oakden-Rayner, L., & Beam, A. L. (2021). The false hope of current approaches to explainable artificial intelligence in health care. The Lancet. Digital Health, 3(11), e745–e750. https://doi.org/10.1016/S2589-7500(21)00208-9
Ginat, D. T. (2020). Analysis of head CT scans flagged by deep learning software for acute intracranial hemorrhage. Neuroradiology, 62(3), 335–340. https://doi.org/10.1007/ s00234-019-02330-w
Goebel, J., Stenzel, E., Guberina, N., Wanke, I., Koehrmann, M., Kleinschnitz, C., Umutlu, L., Forsting, M., Moenninghoff, C., & Radbruch, A. (2018). Automated ASPECT rating: comparison between the Frontier ASPECT Score software and the Brainomix software. Neuroradiology, 60(12), 1267–1272. https://doi.org/10.1007/s00234-018-2098-x
Habli, I., Lawton, T., & Porter, Z. (2020). Artificial intelligence in health care: accountability and safety. Bulletin of the World Health Organization, 98(4), 251–256. https://doi.org/10.2471/ BLT.19.237487
Halabi, S. S., Prevedello, L. M., Kalpathy-Cramer, J., Mamonov, A. B., Bilbily, A., Cicero, M., Pan, I., Pereira, L. A., Sousa, R. T., Abdala, N., Kitamura, F. C., Thodberg, H. H., Chen, L., Shih, G., Andriole, K., Kohli, M. D., Erickson, B. J., & Flanders, A. E. (2019). The RSNA Pediatric Bone Age Machine Learning Challenge. Radiology, 290(2), 498–503. https://doi. org/10.1148/radiol.2018180736
Hargreaves, B. A., Worters, P. W., Pauly, K. B., Pauly, J. M., Koch, K. M., & Gold, G. E. (2011). Metal-induced artifacts in MRI. AJR. American Journal of Roentgenology, 197(3), 547–555. https://doi.org/10.2214/AJR.11.7364
Harry, E., Sinsky, C., Dyrbye, L. N., Makowski, M. S., Trockel, M., Tutty, M., Carlasare, L. E., West, C. P., & Shanafelt, T. D. (2021). Physician Task Load and the Risk of Burnout Among US Physicians in a National Survey. Joint Commission Journal on Quality and Patient Safety / Joint Commission Resources, 47(2), 76–85. https://doi.org/10.1016/j.jcjq.2020.09.011
Hata, A., Yanagawa, M., Yamagata, K., Suzuki, Y., Kido, S., Kawata, A., Doi, S., Yoshida, Y., Miyata, T., Tsubamoto, M., Kikuchi, N., & Tomiyama, N. (2021). Deep learning algorithm for detection of aortic dissection on non-contrast-enhanced CT. European Radiology, 31(2), 1151–1159. https://doi.org/10.1007/ s00330-020-07213-w
Hauptmann, A., Arridge, S., Lucka, F., Muthurangu, V., & Steeden, J. A. (2019). Real-time cardiovascular MR with
spatio-temporal artifact suppression using deep learning-proof of concept in congenital heart disease. Magnetic Resonance in Medicine: Official Journal of the Society of Magnetic Resonance in Medicine / Society of Magnetic Resonance in Medicine, 81(2), 1143–1156. https://doi.org/10.1002/mrm.27480
Health Ethics & Governance. (2021, June 28). Ethics and governance of artificial intelligence for health. World Health Organization. https://www.who.int/publications/i/ item/9789240029200
He, L., Li, H., Dudley, J. A., Maloney, T. C., Brady, S. L., Somasundaram, E., Trout, A. T., & Dillman, J. R. (2019). Machine Learning Prediction of Liver Stiffness Using Clinical and T2-Weighted MRI Radiomic Data. AJR. American Journal of Roentgenology, 213(3), 592–601. https://doi.org/10.2214/ AJR.19.21082
Herent, P., Schmauch, B., Jehanno, P., Dehaene, O., Saillard, C., Balleyguier, C., Arfi-Rouche, J., & Jégou, S. (2019).
Detection and characterization of MRI breast lesions using deep learning. Diagnostic and Interventional Imaging, 100(4), 219–225. https://doi.org/10.1016/j.diii.2019.02.008
Hinton, B., Ma, L., Mahmoudzadeh, A. P., Malkov, S., Fan, B., Greenwood, H., Joe, B., Lee, V., Kerlikowske, K., & Shepherd,
J. (2019). Deep learning networks find unique mammographic differences in previous negative mammograms between interval and screen-detected cancers: a case-case study. Cancer Imaging: The Official Publication of the International Cancer Imaging Society, 19(1), 41. https://doi.org/10.1186/s40644-019-0227-3
Holzinger, A., Biemann, C., Pattichis, C. S., & Kell, D. B. (2017). What do we need to build explainable AI systems for the medical domain? In arXiv [cs.AI]. arXiv. http://arxiv.org/ abs/1712.09923
Hötker, A. M., Da Mutten, R., Tiessen, A., Konukoglu, E., & Donati, O. F. (2021). Improving workflow in prostate MRI:
AI-based decision-making on biparametric or multiparametric MRI. Insights into Imaging, 12(1), 112. https://doi.org/10.1186/ s13244-021-01058-7
Huang, S.-C., Kothari, T., Banerjee, I., Chute, C., Ball, R. L., Borus, N., Huang, A., Patel, B. N., Rajpurkar, P., Irvin, J., Dunnmon, J., Bledsoe, J., Shpanskaya, K., Dhaliwal, A., Zamanian, R., Ng, A. Y., & Lungren, M. P. (2020). PENet-a scalable deep-learning model for automated diagnosis of pulmonary embolism using volumetric CT imaging. NPJ Digital Medicine, 3, 61. https://doi.org/10.1038/s41746-020-0266-y
Huang, S.-C., Pareek, A., Seyyedi, S., Banerjee, I., & Lungren, M. P. (2020). Fusion of medical imaging and electronic health records using deep learning: a systematic review and implementation guidelines. NPJ Digital Medicine, 3, 136. https:// doi.org/10.1038/s41746-020-00341-z
Huisman, M., Ranschaert, E., Parker, W., Mastrodicasa, D., Koci, M., Pinto de Santos, D., Coppola, F., Morozov, S., Zins, M., Bohyn, C., Koç, U., Wu, J., Veean, S., Fleischmann, D., Leiner, T., & Willemink, M. J. (2021). An international survey on AI in radiology in 1,041 radiologists and radiology residents part 1: fear of replacement, knowledge, and attitude. European Radiology, 31(9), 7058–7066. https://doi.org/10.1007/s00330-021-07781-5
Hu, S.-Y., Santus, E., Forsyth, A. W., Malhotra, D., Haimson, J., Chatterjee, N. A., Kramer, D. B., Barzilay, R., Tulsky,
J. A., & Lindvall, C. (2019). Can machine learning improve patient selection for cardiac resynchronization therapy? PloS One, 14(10), e0222397. https://doi.org/10.1371/journal. pone.0222397
Hwang, E. J., Nam, J. G., Lim, W. H., Park, S. J., Jeong, Y. S., Kang, J. H., Hong, E. K., Kim, T. M., Goo, J. M., Park, S., Kim, K. H., & Park, C. M. (2019). Deep Learning for Chest Radiograph Diagnosis in the Emergency Department. Radiology, 293(3), 573–580. https://doi.org/10.1148/radiol.2019191225
Hwang, E. J., Park, S., Jin, K.-N., Kim, J. I., Choi, S. Y., Lee, J. H., Goo, J. M., Aum, J., Yim, J.-J., Park, C. M., & Deep Learning- Based Automatic Detection Algorithm Development and Evaluation Group. (2019). Development and Validation of a Deep Learning-based Automatic Detection Algorithm for Active Pulmonary Tuberculosis on Chest Radiographs. Clinical Infectious Diseases: An Official Publication of the Infectious Diseases Society of America, 69(5), 739–747. https://doi.org/10.1093/cid/ciy967
Hwang, S., Kim, H.-E., Jeong, J., & Kim, H.-J. (2016). A novel approach for tuberculosis screening based on deep convolutional neural networks. In G. D. Tourassi & S. G. Armato (Eds.), Medical Imaging 2016: Computer-Aided Diagnosis. SPIE. https://doi.org/10.1117/12.2216198
IBM Watson Studio - Model Risk Management. (n.d.). Retrieved June 11, 2022, from https://www.ibm.com/cloud/ watson-studio/model-risk-management
Imaging AI Marketplace - overview. (n.d.). Retrieved June 11, 2022, from https://www.ibm.com/products/imaging-ai- marketplace
Jamaludin, A., Lootus, M., Kadir, T., Zisserman, A., Urban, J., Battié, M. C., Fairbank, J., McCall, I., & Genodisc Consortium. (2017). ISSLS PRIZE IN BIOENGINEERING SCIENCE 2017:
Automation of reading of radiological features from magnetic resonance images (MRIs) of the lumbar spine without human intervention is comparable with an expert radiologist. European Spine Journal: Official Publication of the European Spine Society, the European Spinal Deformity Society, and the European Section of the Cervical Spine Research Society, 26(5), 1374–1383. https:// doi.org/10.1007/s00586-017-4956-3
Kaissis, G. A., Makowski, M. R., Rückert, D., & Braren, R. F. (2020). Secure, privacy-preserving and federated machine learning in medical imaging. Nature Machine Intelligence, 2(6), 305–311. https://doi.org/10.1038/s42256-020-0186-1
Kaissis, G., Ziller, A., Passerat-Palmbach, J., Ryffel, T., Usynin, D., Trask, A., Lima, I., Mancuso, J., Jungmann, F., Steinborn, M.-M., Saleh, A., Makowski, M., Rueckert, D., & Braren, R. (2021). End-to-end privacy preserving deep learning on multi-institutional medical imaging. Nature Machine Intelligence, 3(6), 473–484. https://doi.org/10.1038/s42256-021-00337-8
Kalra, A., Chakraborty, A., Fine, B., & Reicher, J. (2020). Machine Learning for Automation of Radiology Protocols for Quality and Efficiency Improvement. Journal of the American College of Radiology: JACR, 17(9), 1149–1158. https://doi.org/10.1016/j.jacr.2020.03.012
Kao, P.-Y., Chen, J. W., & Manjunath, B. S. (2019). Improving 3D U-Net for Brain Tumor Segmentation by Utilizing Lesion Prior. In arXiv [cs.CV]. arXiv. http://arxiv.org/abs/1907.00281
Kapoor, N., Lacson, R., & Khorasani, R. (2020). Workflow Applications of Artificial Intelligence in Radiology and an Overview of Available Tools. Journal of the American College of Radiology: JACR, 17(11), 1363–1370. https://doi.org/10.1016/j. jacr.2020.08.016
Kathirvelu, D., Vinupritha, P., & Kalpana, V. (2019). A computer aided diagnosis system for measurement of mandibular cortical thickness on dental panoramic radiographs in prediction of women with low bone mineral density. Journal of Medical Systems, 43(6), 148. https://doi.org/10.1007/s10916-019-1268-7
Ker, J., Singh, S. P., Bai, Y., Rao, J., Lim, T., & Wang, L. (2019). Image Thresholding Improves 3-Dimensional Convolutional Neural Network Diagnosis of Different Acute Brain Hemorrhages on Computed Tomography Scans. Sensors, 19(9). https://doi.org/10.3390/s19092167
Khan, F. A., Majidulla, A., Tavaziva, G., Nazish, A., Abidi, S. K., Benedetti, A., Menzies, D., Johnston, J. C., Khan, A. J., & Saeed, S. (2020). Chest x-ray analysis with deep learning- based software as a triage test for pulmonary tuberculosis: a prospective study of diagnostic accuracy for culture-confirmed disease. The Lancet. Digital Health, 2(11), e573–e581. https://doi.org/10.1016/S2589-7500(20)30221-1
Kim, D. W., Jang, H. Y., Kim, K. W., Shin, Y., & Park, S. H. (2019). Design Characteristics of Studies Reporting the Performance of Artificial Intelligence Algorithms for Diagnostic Analysis of Medical Images: Results from Recently Published Papers. Korean Journal of Radiology: Official Journal of the Korean Radiological Society, 20(3), 405–410. https://doi.org/10.3348/ kjr.2019.0025
Kim, K. H., & Park, S.-H. (2017). Artificial neural network for suppression of banding artifacts in balanced steady-state free precession MRI. Magnetic Resonance Imaging, 37, 139–146. https://doi.org/10.1016/j.mri.2016.11.020
Korteling, J. E. H., van de Boer-Visschedijk, G. C., Blankendaal, R. A. M., Boonekamp, R. C., & Eikelboom, A. R. (2021). Human- versus Artificial Intelligence. Frontiers in Artificial Intelligence 4, 622364. https://doi.org/10.3389/ frai.2021.622364
Kühl, N., Goutier, M., Baier, L., Wolff, C., & Martin, D. (2020). Human vs. supervised machine learning: Who learns patterns faster? In arXiv [cs.AI] arXiv. http://arxiv.org/abs/2012.03661
Kuo, W., Häne, C., Mukherjee, P., Malik, J., & Yuh, E. L. (2019). Expert-level detection of acute intracranial hemorrhage on head computed tomography using deep learning. Proceedings of the National Academy of Sciences of the United States of America, 116(45), 22737–22745. https://doi.org/10.1073/ pnas.1908021116
Langerhuizen, D. W. G., Janssen, S. J., Mallee, W. H., van den Bekerom, M. P. J., Ring, D., Kerkhoffs, G. M. M. J., Jaarsma,
R. L., & Doornberg, J. N. (2019). What Are the Applications and Limitations of Artificial Intelligence for Fracture Detection and Classification in Orthopaedic Trauma Imaging? A Systematic Review. Clinical Orthopaedics and Related Research, 477(11), 2482–2491. https://doi.org/10.1097/CORR.0000000000000848
Lang, N., Zhang, Y., Zhang, E., Zhang, J., Chow, D., Chang, P., Yu, H. J., Yuan, H., & Su, M.-Y. (2019). Differentiation of spinal metastases originated from lung and other cancers using radiomics and deep learning based on DCE-MRI. Magnetic Resonance Imaging, 64, 4–12. https://doi.org/10.1016/j. mri.2019.02.013
Larrazabal, A. J., Nieto, N., Peterson, V., Milone, D. H., & Ferrante, E. (2020). Gender imbalance in medical imaging datasets produces biased classifiers for computer-aided diagnosis. Proceedings of the National Academy of Sciences of the United States of America, 117(23), 12592–12594. https://doi.org/10.1073/pnas.1919012117
Lee, J.-S., Adhikari, S., Liu, L., Jeong, H.-G., Kim, H., & Yoon, S.-J. (2019). Osteoporosis detection in panoramic radiographs using a deep convolutional neural network-based computer- assisted diagnosis system: a preliminary study. Dento Maxillo Facial Radiology, 48(1), 20170344. https://doi.org/10.1259/ dmfr.20170344
Lee, Y. H. (2018). Efficiency Improvement in a Busy Radiology Practice: Determination of Musculoskeletal Magnetic Resonance Imaging Protocol Using Deep-Learning Convolutional Neural Networks. Journal of Digital Imaging, 31(5), 604–610. https://doi.org/10.1007/s10278-018-0066-y
Leiner, T., Bennink, E., Mol, C. P., Kuijf, H. J., & Veldhuis, W. B. (2021). Bringing AI to the clinic: blueprint for a vendor-neutral AI deployment infrastructure. Insights into Imaging, 12(1), 11. https://doi.org/10.1186/s13244-020-00931-1
Lekadir, K., Osuala, R., Gallin, C., Lazrak, N., Kushibar, K., Tsakou, G., Aussó, S., Alberich, L. C., Marias, K., Tsiknakis, M., Colantonio, S., Papanikolaou, N., Salahuddin, Z., Woodruff, H. C., Lambin, P., & Martí-Bonmatí, L. (2021). FUTURE-AI: Guiding Principles and Consensus Recommendations for Trustworthy Artificial Intelligence in Medical Imaging. In arXiv [cs.CV]. arXiv. http://arxiv.org/ abs/2109.09658
Letourneau-Guillon, L., Camirand, D., Guilbert, F., & Forghani, R. (2020). Artificial Intelligence Applications for Workflow, Process Optimization and Predictive Analytics. Neuroimaging Clinics of North America, 30(4), e1–e15. https://doi.org/10.1016/j.nic.2020.08.008
Levin, D. C., Parker, L., & Rao, V. M. (2017). Recent Trends in Imaging Use in Hospital Settings: Implications for Future Planning. Journal of the American College of Radiology: JACR, 14(3), 331–336. https://doi.org/10.1016/j.jacr.2016.08.025
Lindsey, R., Daluiski, A., Chopra, S., Lachapelle, A., Mozer, M., Sicular, S., Hanel, D., Gardner, M., Gupta, A., Hotchkiss, R., & Potter, H. (2018). Deep neural network improves fracture detection by clinicians. Proceedings of the National Academy of Sciences of the United States of America, 115(45), 11591–11596. https://doi.org/10.1073/pnas.1806905115
Liu, F., Tang, J., Ma, J., Wang, C., Ha, Q., Yu, Y., & Zhou, Z. (2021). The application of artificial intelligence to chest medical image analysis. Intelligent Medicine, 1(3), 104–117. https://doi.org/10.1016/j.imed.2021.06.004
Liu, F., Zhou, Z., Samsonov, A., Blankenbaker, D., Larison, W., Kanarek, A., Lian, K., Kambhampati, S., & Kijowski, R. (2018). Deep Learning Approach for Evaluating Knee MR Images: Achieving High Diagnostic Performance for Cartilage Lesion Detection. Radiology, 289(1), 160–169. https://doi.org/10.1148/ radiol.2018172986
Liu, X., Cruz Rivera, S., Moher, D., Calvert, M. J., Denniston, A. K., & SPIRIT-AI and CONSORT-AI Working Group. (2020). Reporting guidelines for clinical trial reports for interventions involving artificial intelligence: the CONSORT-AI extension. Nature Medicine, 26(9), 1364–1374. https://doi.org/10.1038/ s41591-020-1034-x
Liu, X., Faes, L., Kale, A. U., Wagner, S. K., Fu, D. J., Bruynseels, A., Mahendiran, T., Moraes, G., Shamdas, M., Kern, C., Ledsam, J. R., Schmid, M. K., Balaskas, K., Topol, E. J., Bachmann, L. M., Keane, P. A., & Denniston, A. K. (2019). A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging: a systematic review and meta-analysis. The Lancet. Digital Health, 1(6), e271–e297. https://doi.org/10.1016/S2589- 7500(19)30123-2
Li, X., Shen, L., Xie, X., Huang, S., Xie, Z., Hong, X., & Yu, J. (2020). Multi-resolution convolutional networks for chest X-ray radiograph based lung nodule detection. Artificial Intelligence in Medicine, 103, 101744. https://doi.org/10.1016/j. artmed.2019.101744
Lotan, E., Tschider, C., Sodickson, D. K., Caplan, A. L., Bruno, M., Zhang, B., & Lui, Y. W. (2020). Medical Imaging and Privacy in the Era of Artificial Intelligence: Myth, Fallacy, and the Future. Journal of the American College of Radiology: JACR, 17(9), 1159–1162. https://doi.org/10.1016/j.jacr.2020.04.007
Maegerlein, C., Fischer, J., Mönch, S., Berndt, M., Wunderlich, S., Seifert, C. L., Lehm, M., Boeckh-Behrens, T., Zimmer, C., & Friedrich, B. (2019). Automated Calculation of the Alberta Stroke Program Early CT Score: Feasibility and
Reliability. Radiology, 291(1), 141–148. https://doi.org/10.1148/ radiol.2019181228
Mairhöfer, D., Laufer, M., Simon, P. M., Sieren, M., Bischof, A., Käster, T., Barth, E., Barkhausen, J., & Martinetz, T. (2021). An AI-based Framework for Diagnostic Quality Assessment of Ankle Radiographs. https://openreview.net/ pdf?id=bj04hJss_xZ
Mancio, J., Pashakhanloo, F., El-Rewaidy, H., Jang, J., Joshi, G., Csecs, I., Ngo, L., Rowin, E., Manning, W., Maron, M., & Nezafat, R. (2022). Machine learning phenotyping of scarred myocardium from cine in hypertrophic cardiomyopathy. European Heart Journal Cardiovascular Imaging, 23(4), 532–542. https://doi.org/10.1093/ehjci/jeab056
Matsoukas, S., Morey, J., Lock, G., Chada, D., Shigematsu, T., Marayati, N. F., Delman, B. N., Doshi, A., Majidi, S.,
De Leacy, R., Kellner, C. P., & Fifi, J. T. (2022). AI software detection of large vessel occlusion stroke on CT angiography: a real-world prospective diagnostic test accuracy study. Journal of Neurointerventional Surgery. https://doi.org/10.1136/ neurintsurg-2021-018391
McKinney, S. M., Sieniek, M., Godbole, V., Godwin, J., Antropova, N., Ashrafian, H., Back, T., Chesus, M., Corrado, G. S., Darzi, A., Etemadi, M., Garcia-Vicente, F., Gilbert, F. J., Halling-Brown, M., Hassabis, D., Jansen, S., Karthikesalingam, A., Kelly, C. J., King, D., … Shetty, S. (2020). International evaluation of an AI system for breast cancer screening. Nature, 577(7788), 89–94. https://doi.org/10.1038/s41586-019-1799-6
McLeavy, C. M., Chunara, M. H., Gravell, R. J., Rauf, A., Cushnie, A., Staley Talbot, C., & Hawkins, R. M. (2021). The future of CT: deep learning reconstruction. Clinical Radiology, 76(6), 407–415. https://doi.org/10.1016/j.crad.2021.01.010
Medical AI evaluation. (n.d.). Retrieved June 26, 2022, from https://ericwu09.github.io/medical-ai-evaluation/
Mlynarski, P., Delingette, H., Criminisi, A., & Ayache, N. (2019). Deep learning with mixed supervision for brain tumor segmentation. Journal of Medical Imaging (Bellingham, Wash.), 6(3), 034002. https://doi.org/10.1117/1.JMI.6.3.034002
Mongan, J., Moy, L., & Kahn, C. E., Jr. (2020). Checklist for Artificial Intelligence in Medical Imaging (CLAIM): A Guide for Authors and Reviewers. Radiology. Artificial Intelligence, 2(2), e200029. https://doi.org/10.1148/ryai.2020200029
Moon, H., Huo, Y., Abramson, R. G., Peters, R. A., Assad, A., Moyo, T. K., Savona, M. R., & Landman, B. A. (2019). Acceleration of spleen segmentation with end-to-end deep learning method and automated pipeline. Computers in Biology and Medicine, 107, 109–117. https://doi.org/10.1016/j.compbiomed.2019.01.018
Morey, J. R., Zhang, X., Yaeger, K. A., Fiano, E., Marayati, N. F., Kellner, C. P., De Leacy, R. A., Doshi, A., Tuhrim, S., & Fifi, J. T. (2021). Real-World Experience with Artificial Intelligence- Based Triage in Transferred Large Vessel Occlusion Stroke Patients. Cerebrovascular Diseases, 50(4), 450–455. https://doi. org/10.1159/000515320
Murdoch, B. (2021). Privacy and artificial intelligence: challenges for protecting health information in a new era. BMC Medical Ethics, 22(1), 122. https://doi.org/10.1186/s12910-021-00687-3
Murray, N. M., Unberath, M., Hager, G. D., & Hui, F. K. (2020). Artificial intelligence to diagnose ischemic stroke and identify large vessel occlusions: a systematic review. Journal of Neurointerventional Surgery, 12(2), 156–164. https://doi.org/10.1136/neurintsurg-2019-015135
Nagendran, M., Chen, Y., Lovejoy, C. A., Gordon, A. C., Komorowski, M., Harvey, H., Topol, E. J., Ioannidis, J. P. A., Collins, G. S., & Maruthappu, M. (2020). Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies. BMJ, 368. https://doi.org/10.1136/bmj.m689
Nair, T., Precup, D., Arnold, D. L., & Arbel, T. (2020). Exploring uncertainty measures in deep networks for Multiple sclerosis lesion detection and segmentation. Medical Image Analysis, 59, 101557. https://doi.org/10.1016/j.media.2019.101557
Nakao, T., Hanaoka, S., Nomura, Y., Sato, I., Nemoto, M., Miki, S., Maeda, E., Yoshikawa, T., Hayashi, N., & Abe, O. (2018). Deep neural network-based computer-assisted detection of cerebral aneurysms in MR angiography. Journal of Magnetic Resonance Imaging: JMRI, 47(4), 948–953. https://doi.org/10.1002/jmri.25842
Nam, J. G., Kim, M., Park, J., Hwang, E. J., Lee, J. H., Hong, J. H., Goo, J. M., & Park, C. M. (2021). Development and validation of a deep learning algorithm detecting 10 common abnormalities on chest radiographs. The European Respiratory Journal: Official Journal of the European Society for Clinical Respiratory Physiology, 57(5). https://doi.org/10.1183/13993003.03061-2020
Narayana, P. A., Coronado, I., Sujit, S. J., Wolinsky, J. S., Lublin, F. D., & Gabr, R. E. (2020). Deep Learning for Predicting Enhancing Lesions in Multiple Sclerosis from Noncontrast. MRI. Radiology, 294(2), 398–404. https://doi.org/10.1148/ radiol.2019191061
National Institute for Health and Care Excellence (NICE). (n.d.). Evidence standards framework for digital health technologies. Retrieved June 10, 2022, from https://www.nice.org.uk/corporate/ecd7
Neisius, U., El-Rewaidy, H., Nakamori, S., Rodriguez, J., Manning, W. J., & Nezafat, R. (2019). Radiomic Analysis of Myocardial Native T1 Imaging Discriminates Between Hypertensive Heart Disease and Hypertrophic Cardiomyopathy. JACC. Cardiovascular Imaging, 12(10), 1946–1954. https://doi. org/10.1016/j.jcmg.2018.11.024
Nelson, A., Herron, D., Rees, G., & Nachev, P. (2019). Predicting scheduled hospital attendance with artificial intelligence. Npj Digital Medicine, 2(1), 26. https://doi.org/10.1038/s41746-019-0103-3
Nielsen, A., Hansen, M. B., Tietze, A., & Mouridsen, K. (2018). Prediction of Tissue Outcome and Assessment of Treatment Effect in Acute Ischemic Stroke Using Deep Learning. Stroke; a Journal of Cerebral Circulation, STROKEAHA.117.019740. https://doi.org/10.1161/STROKEAHA.117.019740
Norori, N., Hu, Q., Aellen, F. M., Faraci, F. D., & Tzovara, A. (2021). Addressing bias in big data and AI for health care: A call for open science. Patterns (New York, N.Y.), 2(10), 100347. https://doi.org/10.1016/j.patter.2021.100347
O’Connor, S. D., & Bhalla, M. (2021). Should Artificial Intelligence Tell Radiologists Which Study to Read Next? [Review of Should Artificial Intelligence Tell Radiologists Which Study to Read Next?]. Radiology. Artificial Intelligence, 3(2), e210009. https://doi.org/10.1148/ryai.2021210009
Office for Civil Rights (OCR). (2012, September 7). Guidance Regarding Methods for De-identification of Protected Health Information in Accordance with the Health Insurance Portability and Accountability Act (HIPAA) Privacy Rule. HHS.gov; US Department of Health and Human Services. https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de- identification/index.html
Oktay, O., Schlemper, J., Le Folgoc, L., Lee, M., Heinrich, M., Misawa, K., Mori, K., McDonagh, S., Hammerla, N. Y.,
Kainz, B., Glocker, B., & Rueckert, D. (2018). Attention U-Net: Learning Where to Look for the Pancreas. In arXiv [cs.CV]. arXiv. http://arxiv.org/abs/1804.03999
Olczak, J., Fahlberg, N., Maki, A., Razavian, A. S., Jilert, A., Stark, A., Sköldenberg, O., & Gordon, M. (2017). Artificial intelligence for analyzing orthopedic trauma radiographs. Acta Orthopaedica, 88(6), 581–586. https://doi.org/10.1080/1745367
4.2017.1344459
Olthof, A. W., van Ooijen, P. M. A., & Rezazade Mehrizi, M. H. (2020). Promises of artificial intelligence in neuroradiology: a systematic technographic review. Neuroradiology, 62(10), 1265–1278. https://doi.org/10.1007/s00234-020-02424-w
Omoumi, P., Ducarouge, A., Tournier, A., Harvey, H., Kahn, C. E., Jr, Louvet-de Verchère, F., Pinto Dos Santos, D., Kober, T., & Richiardi, J. (2021). To buy or not to buy-evaluating commercial AI solutions in radiology (the ECLAIR guidelines). European Radiology, 31(6), 3786–3796. https://doi.org/10.1007/ s00330-020-07684-x
O’Neill, T. J., Xi, Y., Stehel, E., Browning, T., Ng, Y. S., Baker, C., & Peshock, R. M. (2021). Active Reprioritization of the Reading Worklist Using Artificial Intelligence Has a Beneficial Effect on the Turnaround Time for Interpretation of Head CT with Intracranial Hemorrhage. Radiology. Artificial Intelligence, 3(2), e200024. https://doi.org/10.1148/ryai.2020200024
Ooi, S. K. G., Makmur, A., Soon, A. Y. Q., Fook-Chong, S., Liew, C., Sia, S. Y., Ting, Y. H., & Lim, C. Y. (2021). Attitudes toward artificial intelligence in radiology with learner needs assessment within radiology residency programmes: a national multi-programme survey. Singapore Medical Journal, 62(3), 126–134. https://doi.org/10.11622/smedj.2019141
Pan, Y., Shi, D., Wang, H., Chen, T., Cui, D., Cheng, X., & Lu, Y. (2020). Automatic opportunistic osteoporosis screening using low-dose chest computed tomography scans obtained for lung cancer screening. European Radiology, 30(7), 4107–4116. https://doi.org/10.1007/s00330-020-06679-y
Park, H. J., Kim, S. M., La Yun, B., Jang, M., Kim, B., Jang, J. Y., Lee, J. Y., & Lee, S. H. (2019). A computer-aided diagnosis system using artificial intelligence for the diagnosis and characterization of breast masses on ultrasound: Added value for the inexperienced breast radiologist. Medicine, 98(3), e14146. https://doi.org/10.1097/MD.0000000000014146
Price, I. I., & Nicholson, W. (2019). Medical AI and Contextual Bias. https://papers.ssrn.com/abstract=3347890
Puvanasunthararajah, S., Fontanarosa, D., Wille, M.-L., & Camps, S. M. (2021). The application of metal artifact reduction methods on computed tomography scans for radiotherapy applications: A literature review. Journal of Applied Clinical Medical Physics / American College of Medical Physics, 22(6), 198–223. https://doi.org/10.1002/acm2.13255
Qin, Z. Z., Sander, M. S., Rai, B., Titahong, C. N., Sudrungrot, S., Laah, S. N., Adhikari, L. M., Carter, E. J., Puri, L., Codlin, A. J., & Creswell, J. (2019). Using artificial intelligence to read chest radiographs for tuberculosis detection: A multi-site evaluation of the diagnostic accuracy of three deep learning systems. Scientific Reports, 9(1), 15000. https://doi.org/10.1038/ s41598-019-51503-3
Ramspek, C. L., Jager, K. J., Dekker, F. W., Zoccali, C., & van Diepen, M. (2021). External validation of prognostic models: what, why, how, when and where?
Rao, B., Zohrabian, V., Cedeno, P., Saha, A., Pahade, J., & Davis, M. A. (2021). Utility of Artificial Intelligence Tool as a Prospective Radiology Peer Reviewer - Detection of Unreported Intracranial Hemorrhage. Academic Radiology, 28(1), 85–93. https://doi.org/10.1016/j.acra.2020.01.035
Reddy, S., Allan, S., Coghlan, S., & Cooper, P. (2020). A governance model for the application of AI in health care. Journal of the American Medical Informatics Association: JAMIA, 27(3), 491–497. https://doi.org/10.1093/jamia/ocz192
Reddy, S., Rogers, W., Makinen, V.-P., Coiera, E., Brown, P., Wenzel, M., Weicken, E., Ansari, S., Mathur, P., Casey, A., & Kelly, B. (2021). Evaluation framework to guide implementation of AI systems into healthcare settings. BMJ Health & Care Informatics, 28(1). https://doi.org/10.1136/ bmjhci-2021-100444
Reyes, M., Meier, R., Pereira, S., Silva, C. A., Dahlweid, F.-M., von Tengg-Kobligk, H., Summers, R. M., & Wiest, R. (2020). On the Interpretability of Artificial Intelligence in Radiology: Challenges and Opportunities. Radiology. Artificial Intelligence, 2(3), e190043. https://doi.org/10.1148/ryai.2020190043
Rezazade Mehrizi, M. H., van Ooijen, P., & Homan, M. (2021). Applications of artificial intelligence (AI) in diagnostic radiology: a technography study. European Radiology, 31(4), 1805–1811. https://doi.org/10.1007/s00330-020-07230-9
Richardson, J. P., Smith, C., Curtis, S., Watson, S., Zhu, X., Barry, B., & Sharp, R. R. (2021). Patient apprehensions about the use of artificial intelligence in healthcare. NPJ Digital Medicine, 4(1), 140. https://doi.org/10.1038/s41746-021-00509-1
Richardson, M. L., Garwood, E. R., Lee, Y., Li, M. D., Lo, H. S., Nagaraju, A., Nguyen, X. V., Probyn, L., Rajiah, P., Sin, J., Wasnik, A. P., & Xu, K. (2021). Noninterpretive Uses of Artificial Intelligence in Radiology. Academic Radiology, 28(9), 1225– 1235. https://doi.org/10.1016/j.acra.2020.01.012
Rockenbach, M. A. B. (2021, June 13). Multimodal AI in healthcare: Closing the gaps. CodeX. https://medium.com/codex/ multimodal-ai-in-healthcare-1f5152e83be2
Rodríguez-Ruiz, A., Krupinski, E., Mordang, J.-J., Schilling, K., Heywang-Köbrunner, S. H., Sechopoulos, I., & Mann, R. M. (2019). Detection of Breast Cancer with Mammography: Effect of an Artificial Intelligence Support System. Radiology, 290(2), 305–314. https://doi.org/10.1148/radiol.2018181371
Rodriguez-Ruiz, A., Lång, K., Gubern-Merida, A., Broeders, M., Gennaro, G., Clauser, P., Helbich, T. H., Chevalier, M., Tan, T., Mertelmeier, T., Wallis, M. G., Andersson, I., Zackrisson, S., Mann, R. M., & Sechopoulos, I. (2019). Stand- Alone Artificial Intelligence for Breast Cancer Detection in Mammography: Comparison With 101 Radiologists. Journal of the National Cancer Institute, 111(9), 916–922. https://doi.org/10.1093/jnci/djy222
Santomartino, S. M., & Yi, P. H. (2022). Systematic Review of Radiologist and Medical Student Attitudes on the Role and Impact of AI in Radiology. Academic Radiology. https://doi.org/10.1016/j.acra.2021.12.032
Schemmel, A., Lee, M., Hanley, T., Pooler, B. D., Kennedy, T., Field, A., Wiegmann, D., & Yu, J.-P. J. (2016). Radiology Workflow Disruptors: A Detailed Analysis. Journal of the American College of Radiology: JACR, 13(10), 1210–1214. https://doi.org/10.1016/j.jacr.2016.04.009
Schreiber-Zinaman, J., & Rosenkrantz, A. B. (2017). Frequency and reasons for extra sequences in clinical abdominal MRI examinations. Abdominal Radiology (New York), 42(1), 306–311. https://doi.org/10.1007/s00261-016-0877-6
Scott, I. A., Carter, S. M., & Coiera, E. (2021). Exploring stakeholder attitudes towards AI in clinical practice. BMJ Health & Care Informatics, 28(1). https://doi.org/10.1136/ bmjhci-2021-100450
Seah, J. C. Y., Tang, C. H. M., Buchlak, Q. D., Holt, X. G., Wardman, J. B., Aimoldin, A., Esmaili, N., Ahmad, H., Pham, H., Lambert, J. F., Hachey, B., Hogg, S. J. F., Johnston, B. P., Bennett, C., Oakden-Rayner, L., Brotchie, P., & Jones, C. M. (2021). Effect of a comprehensive deep-learning model on the accuracy of chest x-ray interpretation by radiologists: a retrospective, multireader multicase study. The Lancet. Digital Health, 3(8), e496–e506. https://doi.org/10.1016/S2589- 7500(21)00106-0
Sectra Amplifier Marketplace. (2021, July 5). Sectra Medical. https://medical.sectra.com/product/sectra-amplifier- marketplace/
Sermesant, M., Delingette, H., Cochet, H., Jaïs, P., & Ayache, N. (2021). Applications of artificial intelligence in cardiovascular imaging. Nature Reviews. Cardiology, 18(8), 600–609. https://doi.org/10.1038/s41569-021-00527-2
Setio, A. A. A., Traverso, A., de Bel, T., Berens, M. S. N., van den Bogaard, C., Cerello, P., Chen, H., Dou, Q., Fantacci, M. E., Geurts, B., Gugten, R. van der, Heng, P. A., Jansen, B., de Kaste, M. M. J., Kotov, V., Lin, J. Y.-H., Manders, J. T. M. C., Sóñora-Mengana, A., García-Naranjo, J. C., … Jacobs, C. (2017). Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: The LUNA16 challenge. Medical Image Analysis, 42, 1–13. https://doi.org/10.1016/j.media.2017.06.015
Seyyed-Kalantari, L., Zhang, H., McDermott, M. B. A., Chen, I. Y., & Ghassemi, M. (2021). Underdiagnosis bias of artificial intelligence algorithms applied to chest radiographs in under- served patient populations. Nature Medicine, 27(12), 2176– 2182. https://doi.org/10.1038/s41591-021-01595-0
Shan, H., Padole, A., Homayounieh, F., Kruger, U., Khera, R. D., Nitiwarangkul, C., Kalra, M. K., & Wang, G. (2019). Competitive performance of a modularized deep neural network compared to commercial algorithms for low-dose CT image reconstruction. Nature Machine Intelligence, 1(6), 269–276. https://doi.org/10.1038/s42256-019-0057-9
Sharma, K., Rupprecht, C., Caroli, A., Aparicio, M. C., Remuzzi, A., Baust, M., & Navab, N. (2017). Automatic Segmentation of Kidneys using Deep Learning for Total Kidney Volume Quantification in Autosomal Dominant Polycystic Kidney Disease. Scientific Reports, 7(1), 2049. https://doi.org/10.1038/s41598-017-01779-0
Shelmerdine, S. C., Arthurs, O. J., Denniston, A., & Sebire, N. J. (2021). Review of study reporting guidelines for clinical studies using artificial intelligence in healthcare. BMJ Health & Care Informatics, 28(1). https://doi.org/10.1136/ bmjhci-2021-100385
Shinagare, A. B., Ip, I. K., Abbett, S. K., Hanson, R., Seltzer, S. E., & Khorasani, R. (2014). Inpatient imaging utilization: trends of the past decade. AJR. American Journal of Roentgenology, 202(3), W277–W283. https://doi.org/10.2214/AJR.13.10986
Shlobin, N. A., Baig, A. A., Waqas, M., Patel, T. R., Dossani, R. H., Wilson, M., Cappuzzo, J. M., Siddiqui, A. H., Tutino, V. M., & Levy, E. I. (2022). Artificial Intelligence for Large-Vessel Occlusion Stroke: A Systematic Review. World Neurosurgery, 159, 207–220.e1. https://doi.org/10.1016/j.wneu.2021.12.004
Silberg, J., & Manyika, J. (2019, June 6). Tackling bias in artificial intelligence (and in humans). McKinsey & Company. https://www.mckinsey.com/featured-insights/artificial- intelligence/tackling-bias-in-artificial-intelligence-and-in- humans
Singh, S., Kalra, M. K., Hsieh, J., Licato, P. E., Do, S., Pien, H. H., & Blake, M. A. (2010). Abdominal CT: comparison of adaptive statistical iterative and filtered back projection reconstruction techniques. Radiology, 257(2), 373–383. https://doi.org/10.1148/radiol.10092212
Smith-Bindman, R., Kwan, M. L., Marlow, E. C., Theis, M. K., Bolch, W., Cheng, S. Y., Bowles, E. J. A., Duncan, J. R.,
Greenlee, R. T., Kushi, L. H., Pole, J. D., Rahm, A. K., Stout, N. K., Weinmann, S., & Miglioretti, D. L. (2019). Trends in Use of Medical Imaging in US Health Care Systems and in Ontario, Canada, 2000-2016. JAMA: The Journal of the American Medical Association, 322(9), 843–856. https://doi.org/10.1001/ jama.2019.11456
Sutherland, G., Russell, N., Gibbard, R., & Dobrescu, A. (n.d.). The value of radiology, part II. https://car.ca/wp-content/ uploads/2019/07/value-of-radiology-part-2-en.pdf
Tamada, D., Kromrey, M.-L., Ichikawa, S., Onishi, H., & Motosugi, U. (2020). Motion Artifact Reduction Using a Convolutional Neural Network for Dynamic Contrast Enhanced MR Imaging of the Liver. Magnetic Resonance in Medical Sciences: MRMS: An Official Journal of Japan Society of Magnetic Resonance in Medicine, 19(1), 64–76. https://doi.org/10.2463/ mrms.mp.2018-0156
The Medical Futurist. (n.d.). The Medical Futurist. Retrieved February 23, 2022, from https://medicalfuturist.com/fda- approved-ai-based-algorithms/
The Nuance AI Marketplace for Diagnostic Imaging. (n.d.). https://www.nuance.com/content/dam/nuance/en_us/collateral/ healthcare/data-sheet/ds-ai-marketplace-for-diagnostic- imaging-en-us.pdf
Thodberg, H. H., Kreiborg, S., Juul, A., & Pedersen, K. D. (2009). The BoneXpert method for automated determination of skeletal maturity. IEEE Transactions on Medical Imaging, 28(1), 52–66. https://doi.org/10.1109/TMI.2008.926067
Thomas, K. A., Kidziński, Ł., Halilaj, E., Fleming, S. L., Venkataraman, G. R., Oei, E. H. G., Gold, G. E., & Delp, S. L. (2020). Automated Classification of Radiographic Knee Osteoarthritis Severity Using Deep Neural Networks. Radiology. Artificial Intelligence, 2(2), e190065. https://doi.org/10.1148/ ryai.2020190065
Towards trustable machine learning. (2018). Nature Biomedical Engineering, 2(10), 709–710. https://doi.org/10.1038/ s41551-018-0315-x
Trinidad, M. G., Platt, J., & Kardia, S. L. R. (2020). The public’s comfort with sharing health data with third-party commercial companies. Humanities and Social Sciences Communications, 7(1), 1–10. https://doi.org/10.1057/s41599-020-00641-5
Trivedi, H., Mesterhazy, J., Laguna, B., Vu, T., & Sohn, J. H. (2018). Automatic Determination of the Need for Intravenous Contrast in Musculoskeletal MRI Examinations Using IBM Watson’s Natural Language Processing Algorithm. Journal of Digital Imaging, 31(2), 245–251. https://doi.org/10.1007/ s10278-017-0021-3
Tsao, D. N. (2020, July 27). AI in medical diagnostics 2020- 2030: Image recognition, players, clinical applications, forecasts: IDTechEx. https://www.idtechex.com/en/research-report/ai-in- medical-diagnostics-2020-2030-image-recognition-players- clinical-applications-forecasts/766
Tucci, V., Saary, J., & Doyle, T. E. (2022). Factors influencing trust in medical artificial intelligence for healthcare professionals: a narrative review. Journal of Medical Artificial Intelligence, 5, 4–4. https://doi.org/10.21037/jmai-21-25
Ueda, D., Yamamoto, A., Nishimori, M., Shimono, T., Doishita, S., Shimazaki, A., Katayama, Y., Fukumoto, S., Choppin, A., Shimahara, Y., & Miki, Y. (2019). Deep Learning for MR Angiography: Automated Detection of Cerebral Aneurysms. Radiology, 290(1), 187–194. https://doi.org/10.1148/ radiol.2018180901
Urakawa, T., Tanaka, Y., Goto, S., Matsuzawa, H., Watanabe, K., & Endo, N. (2019). Detecting intertrochanteric hip fractures with orthopedist-level accuracy using a deep convolutional neural network. Skeletal Radiology, 48(2), 239–244. https://doi.org/10.1007/s00256-018-3016-3
van Leeuwen, K. G., Schalekamp, S., Rutten, M. J. C. M., van Ginneken, B., & de Rooij, M. (2021). Artificial intelligence in radiology: 100 commercially available products and their scientific evidence. European Radiology, 31(6), 3797–3804. https://doi.org/10.1007/s00330-021-07892-z
Vayena, E., & Blasimme, A. (2017). Biomedical Big Data: New Models of Control Over Access, Use and Governance. Journal of Bioethical Inquiry, 14(4), 501–513. https://doi.org/10.1007/ s11673-017-9809-6
Vayena, E., Blasimme, A., & Cohen, I. G. (2018). Machine learning in medicine: Addressing ethical challenges. PLoS Medicine, 15(11), e1002689. https://doi.org/10.1371/journal. pmed.1002689
Wang, J., Yang, F., Liu, W., Sun, J., Han, Y., Li, D., Gkoutos, G. V., Zhu, Y., & Chen, Y. (2020). Radiomic Analysis of Native T1 Mapping Images Discriminates Between MYH7 and MYBPC3- Related Hypertrophic Cardiomyopathy. Journal of Magnetic Resonance Imaging: JMRI, 52(6), 1714–1721. https://doi.org/10.1002/jmri.27209
Wang, S.-H., Tang, C., Sun, J., Yang, J., Huang, C., Phillips, P., & Zhang, Y.-D. (2018). Multiple Sclerosis Identification by 14-Layer Convolutional Neural Network With Batch Normalization, Dropout, and Stochastic Pooling. Frontiers in Neuroscience, 12, 818. https://doi.org/10.3389/fnins.2018.00818
Watanabe, A. T., Lim, V., Vu, H. X., Chim, R., Weise, E., Liu, J., Bradley, W. G., & Comstock, C. E. (2019). Improved
Cancer Detection Using Artificial Intelligence: a Retrospective Evaluation of Missed Cancers on Mammography. Journal
of Digital Imaging, 32(4), 625–637. https://doi.org/10.1007/ s10278-019-00192-5
Weikert, T., Francone, M., Abbara, S., Baessler, B., Choi, B. W., Gutberlet, M., Hecht, E. M., Loewe, C., Mousseaux, E., Natale, L., Nikolaou, K., Ordovas, K. G., Peebles, C., Prieto, C., Salgado, R., Velthuis, B., Vliegenthart, R., Bremerich, J., & Leiner, T. (2021). Machine learning in cardiovascular radiology: ESCR position statement on design requirements, quality assessment, current applications, opportunities, and challenges. European Radiology, 31(6), 3909–3922. https://doi.org/10.1007/ s00330-020-07417-0
Whittlestone, J., Nyrup, R., Alexandrova, A., Dihal, K., & Cave, S. (2019). Ethical and societal implications of algorithms, data, and artificial intelligence: a roadmap for research.
London: Nuffield Foundation. https://www.nuffieldfoundation. org/sites/default/files/files/Ethical-and-Societal-Implications-of- Data-and-AI-report-Nuffield-Foundat.pdf
WHO operational handbook on tuberculosis Module 2: Screening – Systematic screening for tuberculosis disease. (n.d.). Retrieved June 19, 2022, from https://www.who.int/ publications-detail-redirect/9789240022614
Willemink, M. J., & Noël, P. B. (2019). The evolution of image reconstruction for CT-from filtered back projection to artificial intelligence. European Radiology, 29(5), 2185–2195. https://doi.org/10.1007/s00330-018-5810-7
Winder, M., Owczarek, A. J., Chudek, J., Pilch-Kowalczyk, J., & Baron, J. (2021). Are We Overdoing It? Changes in Diagnostic Imaging Workload during the Years 2010-2020 including the Impact of the SARS-CoV-2 Pandemic. Healthcare (Basel, Switzerland), 9(11). https://doi.org/10.3390/healthcare9111557
Wong, T. T., Kazam, J. K., & Rasiej, M. J. (2019). Effect of Analytics-Driven Worklists on Musculoskeletal MRI
Interpretation Times in an Academic Setting. AJR. American Journal of Roentgenology, 1–5. https://doi.org/10.2214/ AJR.18.20434
Wu, B., Zhou, Z., Wang, J., & Wang, Y. (2018). Joint learning for pulmonary nodule segmentation, attributes and malignancy prediction. 2018 IEEE 15th International Symposium on Biomedical Imaging (ISBI 2018), 1109–1113. https://doi.org/10.1109/ISBI.2018.8363765
Wu, E., Wu, K., Daneshjou, R., Ouyang, D., Ho, D. E., & Zou, J. (2021). How medical AI devices are evaluated: limitations and recommendations from an analysis of FDA approvals. Nature Medicine, 27(4), 582–584. https://doi.org/10.1038/s41591-021-01312-x
Wu, G.-G., Zhou, L.-Q., Xu, J.-W., Wang, J.-Y., Wei, Q., Deng, Y.-B., Cui, X.-W., & Dietrich, C. F. (2019). Artificial intelligence in breast ultrasound. World Journal of Radiology, 11(2), 19–26. https://doi.org/10.4329/wjr.v11.i2.19
Yala, A., Schuster, T., Miles, R., Barzilay, R., & Lehman, C. (2019). A Deep Learning Model to Triage Screening Mammograms: A Simulation Study. Radiology, 293(1), 38–46. https://doi.org/10.1148/radiol.2019182908
Yasaka, K., Akai, H., Kunimatsu, A., Abe, O., & Kiryu, S. (2018). Liver Fibrosis: Deep Convolutional Neural Network for Staging by Using Gadoxetic Acid-enhanced Hepatobiliary Phase MR Images. Radiology, 287(1), 146–155. https://doi.org/10.1148/ radiol.2017171928
Yeung, K. (2018). A Study of the Implications of Advanced Digital Technologies (Including AI Systems) for the Concept of
Responsibility Within a Human Rights Framework. https://papers. ssrn.com/abstract=3286027
Yoo, Y., Tang, L. Y. W., Li, D. K. B., Metz, L., Kolind, S., Traboulsee, A. L., & Tam, R. C. (2019). Deep learning of brain lesion patterns and user-defined clinical and MRI features for predicting conversion to multiple sclerosis from clinically isolated syndrome. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, 7(3), 250–259. https://doi.org/10.1080/21681163.2017.1356750
Yu, A. C., Mohajer, B., & Eng, J. (2022). External Validation of Deep Learning Algorithms for Radiologic Diagnosis: A Systematic Review. Radiology. Artificial Intelligence, 4(3), e210064. https://doi.org/10.1148/ryai.210064
Yu, J.-P. J., Kansagra, A. P., & Mongan, J. (2014). The radiologist’s workflow environment: evaluation of disruptors and potential implications. Journal of the American College of Radiology: JACR, 11(6), 589–593. https://doi.org/10.1016/j. jacr.2013.12.026
Yusuf, M., Atal, I., Li, J., Smith, P., Ravaud, P., Fergie, M., Callaghan, M., & Selfe, J. (2020). Reporting quality of studies using machine learning models for medical diagnosis: a systematic review. BMJ Open, 10(3), e034568. https://doi.org/10.1136/bmjopen-2019-034568
Yu, Y., Xie, Y., Thamm, T., Gong, E., Ouyang, J., Christensen, S., Marks, M. P., Lansberg, M. G., Albers, G. W., & Zaharchuk,
G. (2021). Tissue at Risk and Ischemic Core Estimation Using Deep Learning in Acute Stroke. AJNR. American Journal of Neuroradiology, 42(6), 1030–1037. https://doi.org/10.3174/ajnr. A7081
Yu, Y., Xie, Y., Thamm, T., Gong, E., Ouyang, J., Huang, C., Christensen, S., Marks, M. P., Lansberg, M. G., Albers, G. W., & Zaharchuk, G. (2020). Use of Deep Learning to Predict Final Ischemic Stroke Lesions From Initial Magnetic Resonance Imaging. JAMA Network Open, 3(3), e200772. https://doi.org/10.1001/jamanetworkopen.2020.0772
Zhang, Y., & Yu, H. (2018). Convolutional Neural Network Based Metal Artifact Reduction in X-Ray Computed Tomography. IEEE Transactions on Medical Imaging, 37(6), 1370–1381. https://doi.org/10.1109/TMI.2018.2823083
Zhao, B., Liu, Z., Ding, S., Liu, G., Cao, C., & Wu, H. (2022). Motion artifact correction for MR images based on convolutional neural network. Optoelectronics Letters, 18(1), 54–58. https://doi.org/10.1007/s11801-022-1084-z
Zhao, J., Huang, Y., Song, Y., Xie, D., Hu, M., Qiu, H., & Chu, J. (2020). Diagnostic accuracy and potential covariates for machine learning to identify IDH mutations in glioma patients: evidence from a meta-analysis. European Radiology, 30(8), 4664–4674. https://doi.org/10.1007/s00330-020-06717-9
Zhou, C., Ding, C., Wang, X., Lu, Z., & Tao, D. (2020). One-pass Multi-task Networks with Cross-task Guided Attention for Brain Tumor Segmentation. IEEE Transactions on Image Processing: A Publication of the IEEE Signal Processing Society. https://doi.org/10.1109/TIP.2020.2973510
Zicari, R. V., Brodersen, J., Brusseau, J., Düdder, B., Eichhorn, T., Ivanov, T., Kararigas, G., Kringen, P., McCullough, M., Möslein, F., Mushtaq, N., Roig, G., Stürtz, N., Tolle, K., Tithi, J. J., van Halem, I., & Westerlund, M. (2021). Z-Inspection®: A Process to Assess Trustworthy AI. IEEE Transactions on Technology and Society, 1–1. https://doi.org/10.1109/TTS.2021.3066209