Об ошибках применения математики в биологии, часть 2

II. Ошибки, связанные с избытком энтузиазма Л. А. ЛЮБИЩЕВ Ульяновск 11, Средний Венец 23, кв. 12 ОШИБКИ, ОБЯЗАННЫЕ С НЕДОСТАТОЧНОЙ ТЕОРЕТИЧЕСКОЙ ОБОСНОВАННОСТЬЮ, ЦЕЛЕНАПРАВЛЕННОСТЬЮ И ЭКОНОМИЧНОСТЬЮ РАБОТЫ Ошибки, разобранные в первой статье, связаны или с недоверием к математизации или желанием ограничить применение математики совершенным минимумом. В указанных случаях математика рассматривалась или как яд, или, в лучшем случае, как горькое лекарство. Предмет настоящей статьи - ошибки энтузиастов математизации. Эти ошибки реже приводят к совершенно ошибочным выводам, но вред их тоже немал: они часто направляют исследование по бесперспективным направлениям, могут мешать развитию плодотворных направлений и, наконец, приводят к излишней затрате сил и средств. Эти ошибки также можно разбить на несколько категорий. 1) Недостаточная теоретическая обоснованность . В качестве примера могу привести нашумевший одно время так называемый экспоненциальный закон Яниша (Janisch, 1927). Яниш исходил из совершенно правильного положения, что очень многие биологические закономерности отображаются экспоненциальными кривыми разного вида, но этому положению он придал догматический характер: все решительно биологические законы выражаются только экспоненциальными формулами, и никаких других кривых он не допускал. Началось с частного случая: критики гиперболической зависимости продолжительности развития (насекомых и других организмов) от температуры, но затем в своей книге он придал своему закону общебиологическое значение, что было воспринято рядом биологов как новая эра в биологии. В своей книге он приводит много разнообразных экспоненциальных кривых и показывает их близкое соответствие ряду биологических явлений, но при этом он совершенно не ограничивает себя ни формой кривых, ни числом параметров. Поэтому доказательная сила его чертежей полностью теряется, так как, если не ограничиваться числом параметров, то можно для любых эмпирических данных подыскать самые разнообразные математические закономерности и с таким же успехом говорить о «параболическом» или «синусоидальном» законе. Там же, где Яниш накладывает ограничения на выбор кривых, например при сопоставлении цепной линии с двойной гиперболой, его подход явно проигрывает, так как цепная линия несовместима с принятием биологически вполне оправданного физиологического порога (Любищев, 1969). 2) Увлечение сложными машинами . Мы знаем, конечно, что новые сложные электронно-счетные машины представляют собой одно из величайших достижений современной науки и техники, позволяющее решать такие задачи, которые без их помощи или вовсе неразрешимы, или разрешимы только с непомерной затратой сил и средств. Следует ли из этого, что более высокая цивилизация будет означать решение всякого счета, всех задач только сложными машинами? Думаю, что нет. Сложные машины подобны сложной упряжке: лошадей долго запрягают, но затем они быстро едут. Но есть ли смысл прибегать к сложной упряжке для переезда через улицу? И пешее хождение, наверно, сохранится и тогда, когда человек будет летать на отдаленнейшие планеты. Мне думается, что счетная техника может быть грубо разбита на следующие семь ступеней, не считая разных вспомогательных таблиц, и номограмм: 1) счет в уме; 2) счеты; 3) письменный счет; 4) логарифмическая линейка; 5) арифмометр; 6) клавишно-счетные машины; 7) электронные машины. У нас сейчас в сильном упадке устный счет и в непомерном почете счеты. Я полагаю, что в будущей цивилизации счеты и арифмометр полностью исчезнут, счет в уме восстановит свою былую репутацию как экономнейший метод решения простейших задач, а письменный счет, логарифмическая линейка и клавишные машины будут занимать свое место. Хорошую иллюстрацию приводит Рейхман (Reichmann, 1963, стр. 23). Представитель фирмы сложных счетных машин предложил машину в китайский банк, где еще в ходу были счеты, и договорился о состязании машины со счетами. Но оказалось, что служащий банка закончил подсчет на счетах раньше, чем данные были введены в машину. Означает ли это реабилитацию счетов? Нет, конечно, а только иллюстрирует то положение, что до определенного уровня сложности машины без программирования (каковы арифмометры и клавишно-счетные машины) имеют преимущество перед машинами с программированием, а вряд ли наступит такой момент в истории человечества, когда решать придется только сложные задачи. Гораздо более вероятно предположение, что решению сложной задачи будет предшествовать рекогносцировочная работа по выбору наиболее перспективного и экономного пути исследования. Между тем в современной литературе имеется много попыток сразу переходить к более высокому этапу, минуя предварительную разведку. Например, очень перспективный метод дискриминантных функций нередко иллюстрируется так, что читатель не получает нужного впечатления о ценности этого метода. Так, в работе Матера и Добржанского (Mather & Dobzhansky, 1939) о различении видов-двойников дрозофил используется три признака для построения дискриминантной функции, но выясняется, что два признака нисколько не увеличивают информации, получаемой от первого, а потому все вычисление дискриминантной функции оказывается ненужным. Этот же упрек можно сделать примеру, приведенному в известном руководстве Э. Вебер (Weber, 1956). Гораздо целесообразнее провести предварительное рекогносцировочное исследование и отбор наиболее перспективных признаков (используя мысли, развитые в свое время В. И. Романовским, 1925), что можно проделать, используя простейшие графические приемы, и подвергать дальнейшему комплексированию только перспективные признаки. Для примера могу сослаться на мои работы (Lubischew, 1962; Любищев, 1963). При этом, конечно, возможны некоторые ошибки в смысле переоценки признаков, которые в конечном счете окажутся малоценными, и, наоборот, недооценки таких признаков, которые сами по себе не имеют значения, но в комбинации с другими приобретают высокую значимость. Но такие случаи будут относительно редки; в большинстве же случаев надо ожидать, что предварительная оценка признаков подтвердится и при дальнейшем изучении. Переоценивая опасность, сопряженную с выбором признаков на первом этапе, легко впасть в гораздо более опасную крайность, игнорируя полностью рекогносцировочный этап в исследовании и пуская в обработку сразу большое количество признаков, измеренных на значительном числе объектов. При этом мы действительно сохраняем всю информацию всей совокупности наших измерений, по это достоинство покупается очень дорогой ценой и все-таки не гарантирует нас от ошибок. а) производя сразу большое количество измерений большого количества признаков, мы проделываем огромную работу, недоступную, как правило, механизации в биологической, особенно систематической, работе: когда мы производим браковку после рекогносцировочного исследования на малом числе измерений, мы соблюдаем принцип последовательного анализа и производим очень немного бесполезной работы по измерению признаков, оказавшихся неперспективными; если же браковку мы производили в конце исследования, то количество излишней, оказавшейся бесполезной работы возрастает во много раз; б) при этом, сохраняя всю информацию всей совокупности произведенных измерений, мы никогда не можем быть уверены, что, скажем, при вычислении дискриминантных функций мы исчерпали все наиболее ценные для построения функции признаки, так как число возможных для использования признаков бесконечно, а в выборе признаков мы не можем освободиться от субъективных моментов; в) вводя в работу сразу большое число признаков, мы сильно усложняем вычисления, которые часто оказываются доступными только совершенным числовым машинам; тем самым чрезвычайно сокращается число лиц, могущих работать этими методами: при применении же в данном случае принципа последовательных этапов в работе мы чрезвычайно расширяем круг лиц, могущих работать этими методами, так как работу, оказывается, можно успешно вести, используя только такой простой инструмент, как логарифмическая линейка; вычисления с применением простейших приборов можно производить в самых разнообразных местах (на пароходе, железной дороге) и в любой глуши, тогда как работа с электронными машинами, естественно, привязана к сравнительно небольшому числу научных центров. Все эти недостатки свойственны весьма популярной в настоящее время так называемой нумерической таксономии (Sokal & Sneath, 1963). При этом нумерическая таксономия, используя сразу большое число признаков, уже не в состоянии использовать, как правило, внутритаксонную изменчивость, так как в противном случае вычисления приобретают сложность, недоступную даже для самых совершенных машин; этим теряется огромное количество информации, связанное с внутритаксонной изменчивостью (более подробно см. в моей статье, 1966). Увлечение сложными счетными машинами иногда основано на смешении цели и средства. Верно, что многие сложные научные проблемы невозможно разрешить без помощи очень сложных машин. Поэтому в первом приближении справедливо, что количество счетных машин, используемых в данной стране, может служить показателем высоты научного исследования. Но из этого вовсе не вытекает, что применение сложной машины уже гарантирует в данном случае разрешение важной научной проблемы и что все исследование находится на высоком уровне. Между тем очень часто огромное количество коэффициентов, вычисленное с помощью счетных машин, сравнивается так, как будто каждый коэффициент не имеет своей ошибки. Для примера возьму статьи Л. К. Выханду (1964) и его последователя С. Р. Вельдре (1964). Выханду предлагает для связывания признаков в одну упорядоченную систему метод «максимального корреляционного пути», и, пользуясь этим методом, Вельдре на основе 35 признаков строит схемы максимальных корреляционных путей для самцов и самок ушастой кругоголовки (рисунок в его статье на стр. 77). Эти две схемы для самцов и самок резко отличаются друг от друга. Вельдре приходит к выводу (стр. 85), что «центром общей корреляционной плеяды пластических признаков является у самок передняя нога, а у самцов - задняя». Этому различию автор придает биологический смысл (стр. 85): «Удача размножения во многом зависит от роющей способности самок, а при рытье передние ноги важнее, чем задние. Поэтому у самок передняя нога более дифференцирована от общей системы пластических признаков. Зато у самцов важнее задние ноги, от которых зависит быстрота самца при драках с другими самцами и быстрота преследования самок». Для постороннего человека может показаться, что этот вывод «математически обоснован», да еще с помощью электронных счетных машин. Но если мы присмотримся к технике этого метода, то увидим, что там полностью игнорируется общеизвестный факт, что каждый коэффициент корреляции имеет свою погрешность. Из описания метода у Выханду (стр. 20-21) ясно: за начало пути берется признак, имеющий максимальный корреляционный коэффициент, в данном случае 0,717, но следующий по величине коэффициент практически совпадает с максимальным; он равен 0,716. И разбирая рисунок Вельдре, легко убедиться, что там, где, судя по рисунку, должно быть значительное различие коэффициентов, эти различия часто находятся в пределах средних ошибок коэффициентов. Можно поручиться, что при повторении построения схем максимального корреляционного пути на новой выборке из того же материала мы получим совершенно отличный результат (это можно проверить, проделав работу два раза после разделения исходного материала на две части); гипотеза преимущественно-го значения передней ноги самок и задней самцов не получит математи-ческого подтверждения. 3. Погоня за мнимой информацией. Эта ошибка также связана с механизацией вычислительной р

Ошибки

Ошибки

Об ошибках применения математики в биологии, часть 2

Другие статьи

Другие статьи

Новости

23 February 2010Теория ошибок | Edge of Dominus

23 February 2010Сообщения об ошибках BIOS - настройка компьютера и выбор нужных

20 February 2010Коды ошибок из библиотек tspcli.dll и ocspcli.dll