Математические методы оценки информативности симптомов - логика врачебной диагностики
В врачебной диагностике уровень специфичности симптоматики в отношении соответствующего ей заболевания нередко оценивается врачом интуитивным образом, как бы «на глазок». Использование вычислительной техники для диагностических целей привело к выработке точных методов такого рода оценок клинических проявлений диагностируемых патологий. Основу многих из них составляет применение известной формулы Бейеса из теории вероятностей. Применительно к диагностике заболеваний эту формулу можно представить следующим образом (36,35):
В этой формуле приняты следующие обозначения:
Д1 — любой из возможных (в свете исходной диагностической информации) альтернативных диапазонов
J — исходная диагностическая информация, знания, которыми врач располагал до момента обнаружения признака С`.
С` — выявленный в ходе дальнейшего обследования пациента клинический факт, симптом, признак.
р (Д1/J) — вероятность заболевания Д1 в свете исходной диагностической информации, но без учета признака С`. р(С`/Д1. J) — вероятность обнаружения у пациента признака С` при допущении, что данный пациент страдает заболеванием Д1, и в свете исходной диагностической информации J.
p(A/C`, J) — вероятность заболевания Д1 при условии, что у пациента обнаружен признак С`, и в свете первичной диагностической информации J.
Значение показателя р(Д1/Л) существенно варьируется в зависимости от местных условий, в то время как значение показателя р(С`/Д1 J) мало зависит от этих условий. Показатель, непосредственно характеризуя значение условной вероятности диагноза Дь одновременно определяет степень специфичности признака С` в отношении болезни на фоне (в контексте) той диагностической информации, которой врач располагал до обнаружения данного признака в картине болезни обследуемого пациента. Рассмотрим для наглядности гипотетический пример. Предположим, что врачу необходимо осуществить дифференциальную диагностику трех нозологических форм — ревматического (Д1), инфекционноаллергического (Д2) и идиопатического (Абрамова-Фидлера) (Дз) миокардитов. Эти заболевания были объединены врачом в дифференциальный комплекс возможных заболеваний (диагнозов) на основе общей для всех названных болезней симптоматики, обнаруженной у пациента (информация J) — одышка, боль в области сердца, нарушение ритма и проводимости, равномерное увеличение сердца во все стороны и т. п. Предположим также, что врачу стали известны следующие значения (априорной) вероятности этихболезней:
Разберем два варианта этого примера в зависимости от распределения значений показателя условной вероятности признака С7.
В первом варианте в качестве С` будем рассматривать симптом резистентности к проводимой терапии, а во втором — симптом расширения сердца. Произведем соответствующие вычисления:
Хорошо видно, что обнаружение у пациента симптома резистентности к проводимой терапии заметно снизило вероятность наличия у него ревматического миокардита, и что одновременно резко возросли (более чем в четыре раза) «шансы» быть обнаруженным у идиопатического миокарда. Следовательно, уровень специфичности данного признака намного выше в отношении идиопатического миокардита, нежели в отношении ревматического. Это обстоятельство является иллюстрацией общего положения, согласно которому нельзя говорить об уровне специфичности симптомного образования безотносительно к какому-либо конкретному заболеванию. На этом же примере нетрудно убедиться, что уровень специфичности симптомного образования зависит от таких факторов как интервалы значений априорной вероятности дифференцируемых заболеваний и интервалы значений его собственной условной вероятности в отношении данных болезней.
Продолжим наши вычисления:
Этот расчет показывает, что симптомное образование, чей интервал значений условной вероятности в отношении дифференцируемых заболеваний равен нулю, лишено какого-либо диагностического «веса» в распознавании данных болезней, и в этом смысле является абсолютно неспецифическим.
Естественно, что ни один врач во время обследования пациента не производит вычислений по приведенной выше методике. Тем не менее существует, по-видимому, какой-то интуитивный механизм обработки диагностической информации, позволяющий (хотя бы в некотором приближении, огрубленно) мышлению врача производить аналогичную оценку симптомов.
Другой специализированный способ математической оценки клинических явлений на их специфичность известен под названием метода фазового интервала (6,41). Этот метод предполагает составление многофакторного описания состояния организма больного при помощи определенной совокупности признаков. Обычно число таких признаков довольно значительно — несколько десятков и более. Каждый признак получает свой порядковый номер и при обследовании больного замеряется его значение. В итого состояние больного оценивается системой числовых показателей х1, Х2, .., Хн интерпретируемой в виде точки М в многомерном (n-мерном) пространстве.
В этом пространстве на основе статистического материала фиксируются некоторые области (статистические выборки), множества точек которых соответствуют симптоматике заболеваний. Если в качестве примера рассмотреть систему S, состоящую из трех признаков х1, х2 и х3, то области признаков двух заболеваний Дг и Д в названном пространстве можно представить в геометрически наглядном виде:
SДi и SДj представляют на схеме замкнутые поверхности, очерчивающие границы фазовых областей, внутри которых лежат точки, соответствующие признакам заболеваний Дг и Д. Предположим теперь, что при обследовании больного по признакам х1, х2, х3 выявились в качестве их значений симптомы С1, С2 и С3, в совокупности составляющие симптомокомплекс КС. Если найденная по этим значениям точка M1 находится в центре множества точек, очерчиваемого поверхностью SДX (на схеме это место выделено высокой плотностью точек), то это будет означать, что симптомокомплекс КС является весьма специфическим в отношении заболевания Дг. Аналогично, если этой точкой будет точка М2, лежащая в центре множества, очерчиваемого поверхностью SД1, то данный симптомокомплекс будет весьма специфическим в отношении заболевания Д-. Точка Мо находится на периферии области Дг и, следовательно, уровень специфичности соответствующей ей симптоматики будет значительно ниже. Возможен вариант, когда найденная точка лежит вне объема, очерченного поверхностями SД1 и SД. Это обстоятельство будет означать, что полученная при обследовании больного информация по признакам Х1, х2, х3 является абсолютно неспецифической в отношении заболеваний Дг и Д3.
Более строго оценка уровня специфичности выявленного комплекса симптомов КС производится в рассматриваемом методе вычислением с помощью специальных формул расстояния (интервала) между соответствующей КС точкой в пространстве признаков и центром области признаков некоторого заболевания. В случае двух или трех признаков этот метод иллюстрируется наглядно, и вычисление указанного расстояния не составляет большой трудности. Однако простота и наглядность утрачивается, когда число признаков значительно увеличивается.
Применение математических методов в рассматриваемой области сталкивается с серьезными трудностями, связанными с принятием сильного допущения о независимости друг от друга одновременно протекающих в организме заболеваний, о патогенетической обособленности их симптомов, с введением абстракции стационарности механизма клинических проявлений болезни и т. п., которые, строго говоря, находятся в противоречии с их динамической, патогенетически интегрированной природой. Тем не менее интерес специалистов к этим методам растет и в дальнейшем на этом пути могут быть получены более обнадеживающие результаты (10.32). Во всяком случае, соизмерение врачом собственной оценки того или иного симптома или симптомокомплекса с характеристиками, полученными на основе математических моделей, уже сейчас позволяет повысить степень обоснованности его диагноза. Разработка вероятностных методов оценки симптомов позволит формировать для каждой нозологической единицы наиболее оптимальный комплекс диагностических признаков и на его основе разрабатывать эффективные диагностические алгоритмы.