ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5 323 ÓÄÊ 541.6 ÏÐÈÌÅÍÅÍÈÅ ÈÑÊÓÑÑÒÂÅÍÍÛÕ ÍÅÉÐÎÍÍÛÕ ÑÅÒÅÉ Â ÕÈÌÈ×ÅÑÊÈÕ È ÁÈÎÕÈÌÈ×ÅÑÊÈÕ ÈÑÑËÅÄÎÂÀÍÈßÕ È. È. Áàñêèí, Â. À. Ïàëþëèí, Í. Ñ. Çåôèðîâ (êàôåäðà îðãàíè÷åñêîé õèìèè)  ñòàòüå ðàññìîòðåíû îñíîâíûå íàïðàâëåíèÿ ïðèìåíåíèÿ èñêóññòâåííûõ íåéðîííûõ ñåòåé â õèìè÷åñêèõ è áèîõèìè÷åñêèõ èññëåäîâàíèÿõ. Íàèáîëüøåå âíèìàíèå óäåëåíî ðàáîòàì ïî êîððåëÿöèÿì ìåæäó ñòðîåíèåì õèìè÷åñêèõ ñîåäèíåíèé è ïðîÿâëÿåìûìè èìè ôèçèêî-õèìè÷åñêèìè ñâîéñòâàìè è áèîëîãè÷åñêîé àêòèâíîñòüþ, êîòîðûå îòêðûâàþò âîçìîæíîñòü èñïîëüçîâàíèÿ íåéðîñåòè äëÿ äèçàéíà ìàòåðèàëîâ ñ çàðàíåå çàäàííûìè ñâîéñòâàìè è íîâûõ ôàðìàêîëîãè÷åñêèõ ïðåïàðàòîâ. Ñôîðìóëèðîâàíû îñíîâíûå íàïðàâëåíèÿ ðàáîò ïî ïðèìåíåíèþ èñêóññòâåííûõ íåéðîííûõ ñåòåé â îðãàíè÷åñêîé, àíàëèòè÷åñêîé, ôèçè÷åñêîé è áèîëîãè÷åñêîé îáëàñòÿõ õèìèè.  íàñòîÿùåå âðåìÿ â âû÷èñëèòåëüíîé ìàòåìàòèêå è ïðàêòè÷åñêè âî âñåõ ñâÿçàííûõ ñ íåé íàó÷íûõ è òåõíè÷åñêèõ äèñöèïëèíàõ ïðîèñõîäÿò êîðåííûå èçìåíåíèÿ â ïîíèìàíèè ïðèíöèïîâ îðãàíèçàöèè âû÷èñëèòåëüíîãî ïðîöåññà è ïîäõîäîâ ê ðåøåíèþ ïðèêëàäíûõ çàäà÷, ÷òî âûçâàíî çíà÷èòåëüíûì ðîñòîì èíòåðåñà ê òåîðèè è ïðàêòèêå èñïîëüçîâàíèÿ èñêóññòâåííûõ íåéðîííûõ ñåòåé (ÈÍÑ). Ýòî óæå ïðèâåëî ê ïîÿâëåíèþ íîâûõ íàó÷íûõ äèñöèïëèí, òàêèõ êàê íåéðîèíôîðìàòèêà, íåéðîêîìïüþòèíã è íåéðîìàòåìàòèêà [1, 2]. Ïîÿâèâøèñü îòíîñèòåëüíî íåäàâíî êàê îäíî èç íàïðàâëåíèé â îáëàñòè èñêóññòâåííîãî èíòåëëåêòà, ïðèçâàííîå ìîäåëèðîâàòü íà êîìïüþòåðå ïðîöåññû îáðàáîòêè èíôîðìàöèè, ïðîèñõîäÿùèå â ÷åëîâå÷åñêîì ìîçãó, ÈÍÑ óòâåðäèëè ñåáÿ â êà÷åñòâå âåäóùåãî íàïðàâëåíèÿ ðàçâèòèÿ âû÷èñëèòåëüíîé ìàòåìàòèêè, ïðåâçîéäÿ ïî ÷èñëó ïóáëèêàöèé âñå îñòàëüíûå íàïðàâëåíèÿ, âìåñòå âçÿòûå. Ïðè÷èíà òàêîãî áåñïðåöåäåíòíîãî ðîñòà èíòåðåñà ê ÈÍÑ êðîåòñÿ â èçíà÷àëüíî ïðèñóùåé èì ñïîñîáíîñòè ïîäõîäèòü ê îáðàáîòêå èíôîðìàöèè êàê ê ïðîöåññó ðàñïîçíàâàíèÿ è êëàññèôèêàöèè îáðàçîâ ñîâåðøåííî ïðîèçâîëüíîé è ñêîëü óãîäíî ñëîæíîé ñòðóêòóðû ïðè ïîìîùè íåôîðìàëèçóåìûõ àëãîðèòìîâ, êîòîðûå ñàìè æå íåéðîííûå ñåòè è íàõîäÿò. Ýòî âûãîäíî îòëè÷àåò èõ îò òðàäèöèîííûõ ñïîñîáîâ êîìïüþòåðíîé îáðàáîòêè èíôîðìàöèè ïðè ïîìîùè îïåðàöèé ñ ÷èñëàìè è ñèìâîëàìè, çàðàíåå ñïåöèôèöèðîâàííûõ ïî êàêîìó-ëèáî æåñòêîìó àëãîðèòìó. Ýëåìåíòàðíîé åäèíèöåé îáðàáàòûâàåìîé èíôîðìàöèè â ÈÍÑ ÿâëÿåòñÿ îáðàç ïðîèçâîëüíîé äëèíû, îáû÷íî ïðåäñòàâëÿåìûé â âèäå ëèáî îäíîìåðíîãî âåêòîðà, ëèáî äâóìåðíîé ìàòðèöû ÷èñåë, à ýëåìåíòàðíîé îïåðàöèåé ñðàáàòûâàíèå èñêóññòâåííîãî íåéðîíà (ðèñ. 1), â ïðîöåññå êîòîðîãî ïðîèñõîäèò ñðàâíåíèå âíåøíåãî îáðàçà ñ õðàíÿùèìñÿ â ñâÿçàííûõ ñ íåéðîíîì ñèíàïñàõ ýòàëîíîì ïóòåì âû÷èñëåíèÿ ñêàëÿðíîãî ïðîèçâåäåíèÿ âåêòîðà îáðàçà è âåêòîðà ñèíàïòè÷åñêèõ âåñîâ, âñëåä çà ÷åì íåéðîí ðåàãèðóåò íà òàêîå ñðàâíåíèå ïóòåì âçÿòèÿ ñïåöèàëüíîé ôóíêöèè àêòèâàöèè îò ýòîãî ñêàëÿðíîãî ïðîèçâåäåíèÿ. Ïðè ýòîì ôîðìèðóåòñÿ ñèãíàë, âõîäÿùèé â ñîñòàâ íîâûõ îáðàçîâ, ïîäàþùèõñÿ íà âõîä óæå äðóãèì íåéðîíàì ñåòè. Ïîñêîëüêó âñëåäñòâèå «êîìáèíàòîðíîãî âçðûâà» äëÿ ïðîèçâîëüíûõ îáðàçîâ ïðèíöèïèàëüíî íåâîçìîæíî ïîëíîñòüþ îïèñàòü ïðîèçâîëüíûé àëãîðèòì èõ îáðàáîòêè, òî ÈÍÑ ðåøàþò ýòó çàäà÷ó äðóãèì ñïîñîáîì: îíè ïûòàþòñÿ âîññòàíîâèòü àëãîðèòì ïî åãî íåïîëíîìó îïèñàíèþ, çàäàííîìó â âèäå íàáîðà ïðèìåðîâ. Èíûìè ñëîâàìè, â îñíîâå ðàáîòû ÈÍÑ ëåæèò èñïîëüçîâàíèå àëãîðèòìîâ, ïîëó÷àåìûõ ïðè ïîìîùè îáó÷åíèÿ íà ïðèìåðàõ. Ýòè àëãîðèòìû êîäèðóþòñÿ â ÈÍÑ â âèäå çíà÷åíèé âåñîâ ñèíàïñîâ. Îáó÷åííàÿ òàêèì îáðàçîì ÈÍÑ ñïîñîáíà ðåøàòü çàäà÷ó àïïðîêñèìàöèè íåëèíåéíîé ôóíêöèè ïðîèçâîëüíîãî âèäà îò ìíîãèõ ïåðåìåííûõ è, êàê ÷àñòíûé ñëó÷àé ýòîãî, çàäà÷ó îòíåñåíèÿ îáðàçîâ ê îäíîìó èç êëàññîâ, à òàêæå çàäà÷ó êàòåãîðèçàöèè äàííûõ è îïðåäåëåíèÿ èõ âíóòðåííåé ñòðóêòóðû. ÈÍÑ ðàçíîãî ñòðîåíèÿ ïî-ðàçíîìó îðèåíòèðîâàíû íà ðåøåíèå ýòèõ çàäà÷. Äëÿ ðåøåíèÿ ïåðâîé çàäà÷è îáû÷íî ïðèìåíÿþò ñåòè ïðÿìûõ ñâÿçåé (feed-forward) (ðèñ. 2), îáó÷àåìûå ïðè ïîìîùè àëãîðèòìà îáðàòíîãî ðàñïðîñòðàíåíèÿ îøèáîê (backpropagation), íî èñïîëüçóþòñÿ òàêæå ñåòè âñòðå÷íîãî ðàñïðîñòðàíåíèÿ (counterpropagation), à òàêæå ñåòè ðàäèàëüíûõ ãàóññîâûõ ôóíêöèé RBF, êàñêàäíûå ñåòè êîððåëÿöèé (cascade correlation networks) è ñåòè ôóíêöèîíàëüíûõ ñâÿçåé (functional links networks). Äëÿ ðåøåíèÿ âòîðîé çàäà÷è ÷àùå ïðèìåíÿþò ñåòè Õîïôèëäà (Hopfield) è ñåòè àäàïòèâíîãî ðåçîíàíñà ART, òîãäà êàê äëÿ ðåøåíèÿ òðåòüåé çàäà÷è îáû÷íî èñïîëüçóþò ñàìîîðãàíèçóþùèåñÿ Ðèñ. 1. Ñõåìà ðàáîòû íåéðîíà 324 êàðòû Êîõîíåíà (Kohonen). Êðîìå òîãî, ÈÍÑ ìîãóò áûòü èñïîëüçîâàíû äëÿ èçâëå÷åíèÿ ÿâíûõ çíàíèé èç íàáîðà äàííûõ (data mining). Äëÿ ýòèõ öåëåé ñëóæàò ñïåöèàëüíûå ïðîöåäóðû ïðîðåæèâàíèÿ, óïðîùåíèÿ è «âåðáàëèçàöèè» íåéðîííûõ ñåòåé [1, 2]). ÈÍÑ ìîãóò áûòü ðåàëèçîâàíû ñ ïîìîùüþ êàê íåéðîêîìïüþòåðîâ, òàê è ýìóëÿòîðîâ íåéðîííûõ ñåòåé íà êîìïüþòåðàõ îáû÷íîé àðõèòåêòóðû.  ïîñëåäíèå ãîäû ÈÍÑ íàõîäÿò âñå áîëåå øèðîêîå ïðèìåíåíèå ïðè ðàçðàáîòêå íîâûõ õèìè÷åñêèõ ñîåäèíåíèé è ìàòåðèàëîâ ñ çàðàíåå çàäàííûìè ñâîéñòâàìè (áèáëèîãðàôèþ ïî ïðèìåíåíèþ ÈÍÑ â èçó÷åíèè ñâÿçè õèìè÷åñêàÿ ñòðóêòóðà ñâîéñòâî è õèìè÷åñêàÿ ñòðóêòóðà áèîëîãè÷åñêàÿ àêòèâíîñòü ìîæíî íàéòè â êîìïüþòåðíîé ñåòè Èíòåðíåò ïî àäðåñó http://org.chem.msu.su/ ~baskin/neurchem.html), à òàêæå ïðè ñîçäàíèè íîâûõ ëåêàðñòâåííûõ ïðåïàðàòîâ [3–7]. Ïîäîáíûå ïîäõîäû îáû÷íî îñíîâàíû íà ñâîéñòâàõ ÈÍÑ ðàñïîçíàâàòü ñëîæíûå îáðàçû è àïïðîêñèìèðîâàòü íåïðåðûâíûå ôóíêöèè ïðîèçâîëüíîãî âèäà. Äëÿ ýòîãî íàèáîëåå ÷àñòî èñïîëüçóþò ìåòîäèêè, âêëþ÷àþùèå ïðåäâàðèòåëüíûé ïåðåâîä èíôîðìàöèè î ñâÿçíîñòè ìîëåêóëÿðíîãî ãðàôà, îäíîçíà÷íî îïèñûâàþùåãî ñòðîåíèå õèìè÷åñêîãî ñîåäèíåíèÿ, â âåêòîð èíâàðèàíòîâ ãðàôà, íàçûâàåìûõ ìîëåêóëÿðíûìè äåñêðèïòîðàìè.  äàëüíåéøåì âåêòîðû ìîëåêóëÿðíûõ äåñêðèïòîðîâ, âû÷èñëåííûå äëÿ ñòðóêòóð õèìè÷åñêèõ ñîåäèíåíèé ñ èçâåñòíûìè ñâîéñòâàìè, âìåñòå ñ ïðèñîåäèíåííûìè çíà÷åíèÿìè ñâîéñòâ èñïîëüçóþò â êà÷åñòâå ìíîæåñòâà ïðèìåðîâ äëÿ îáó÷åíèÿ ÈÍÑ êîððåêòíî âîñïðîèçâîäèòü çíà÷åíèå ïðîãíîçèðóåìîãî ñâîéñòâà èñõîäÿ èç ïîäàâàåìîãî íà âõîä ÈÍÑ âåêòîðà ìîëåêóëÿðíûõ äåñêðèïòîðîâ (ðèñ. 3). Äëÿ ýòîé öåëè èñïîëüçóþò, êàê ïðàâèëî, ìíîãîñëîéíûå ÈÍÑ ñ ïðÿìûìè ñâÿçÿìè (feed-forward), îáó÷àåìûå ïî ìåòîäó îáðàòíîãî ðàñïðîñòðàíåíèÿ îøèáîê (backpropagation), õîòÿ â ðÿäå ðàáîò óñïåøíî èñïîëüçîâàëè ÈÍÑ äðóãèõ òèïîâ, íàïðèìåð ñåòè âñòðå÷íîãî ðàñïðîñòðàíåíèÿ (counterpropagation), ãàóññîâû ñåòè, ñåòè êàñêàäíûõ êîððåëÿöèé (cascade correlation) è ñåòè ôóíêöèîíàëüíûõ ñâÿçåé.  ïðîöåññå îáó÷åíèÿ îñóùåñòâëÿåòñÿ êîíòðîëü çà ïðîãíîçèðóþùåé ñïîñîáíîñòüþ ÈÍÑ ïðè ïîìîùè çàðàíåå âûáðàííîé êîíòðîëüíîé âûáîðêè Ðèñ. 2. Ñòðîåíèå ìíîãîñëîéíîé èñêóññòâåííîé íåéðîííîé ñåòè ñ ïðÿìûìè ñâÿçÿìè ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5 Ðèñ. 3. Ñõåìà èñïîëüçîâàíèÿ èñêóññòâåííîé íåéðîííîé ñåòè äëÿ ïðîãíîçèðîâàíèÿ ñâîéñòâ õèìè÷åñêèõ ñîåäèíåíèé ïðèìåðîâ, ÷òî ïîçâîëÿåò èçáåæàòü ïåðåîáó÷åíèÿ (íàìè áûëî ïîêàçàíî, ÷òî íàèáîëåå îáúåêòèâíûå îöåíêè ïðîãíîçèðóþùåé ñïîñîáíîñòè ÈÍÑ ïðè ïðåæäåâðåìåííîì ïðåðûâàíèè îáó÷åíèÿ äàåò èñïîëüçîâàíèå äâóõ êîíòðîëüíûõ âûáîðîê [8]). Êðîìå òîãî, âî ìíîãèõ ñëó÷àÿõ ïðè îáó÷åíèè ïðèìåíÿþòñÿ ðàçëè÷íûå âèäû ðåãóëÿðèçàöèè ñåòè è ïðóíèíãà (÷àñòè÷íîãî óäàëåíèÿ íåíóæíûõ íåéðîíîâ è ðàçðåæåíèÿ ñâÿçåé ìåæäó íèìè) äëÿ óïðîùåíèÿ ñòðóêòóðû ÈÍÑ, óìåíüøåíèÿ ÷èñëà íåîáõîäèìûõ ìîëåêóëÿðíûõ äåñêðèïòîðîâ, ñëåäñòâèåì ÷åãî ÿâëÿåòñÿ ïîâûøåíèå ïðîãíîçèðóþùåé ñïîñîáíîñòè ñåòè [8, 9].  äàëüíåéøåì îáó÷åííàÿ òàêèì îáðàçîì ÈÍÑ ìîæåò áûòü èñïîëüçîâàíà äëÿ ïðîãíîçèðîâàíèÿ ñâîéñòâ õèìè÷åñêèõ ñîåäèíåíèé ñ öåëüþ ïîèñêà òåõ èç íèõ, êîòîðûå óäîâëåòâîðÿþò çàðàíåå çàäàííûì ïàðàìåòðàì.  ðàìêàõ èçëîæåííîé âûøå ìåòîäîëîãèè ìû îäíè èç ïåðâûõ ïðîâåëè ïðè ïîìîùè ÈÍÑ ðàáîòû ïî ïðîãíîçèðîâàíèþ òåìïåðàòóðû êèïåíèÿ, îêòàíîâîãî ÷èñëà, ìîëÿðíîãî îáúåìà, ìîëÿðíîé ðåôðàêöèè, òåïëîòû èñïàðåíèÿ, êðèòè÷åñêîãî äàâëåíèÿ è ïîâåðõíîñòíîãî íàòÿæåíèÿ àëêàíîâ [10], ìóòàãåííîñòè ãåòåðîöèêëè÷åñêèõ àíàëîãîâ àðîìàòè÷åñêèõ óãëåâîäîðîäîâ [11], à òàêæå çíà÷åíèé êîíñòàíò çàìåñòèòåëåé [12].  êà÷åñòâå àëüòåðíàòèâû ðàññìîòðåííîé âûøå ìåòîäîëîãèè, ïîäðàçóìåâàþùåé èñïîëüçîâàíèå ìîëåêóëÿðíûõ äåñêðèïòîðîâ è ñòàíäàðòíûõ ÈÍÑ, áûëè ðàçðàáîòàíû è óñïåøíî îïðîáîâàíû íà ïðàêòèêå ñåòè îñîáîãî ñòðîåíèÿ, ïîçâîëÿþùåãî îáó÷àòüñÿ çàâèñèìîñòè ñâîéñòâ õèìè÷åñêèõ ñîåäèíåíèé íåïîñðåäñòâåííî îò ñòðóêòóð ñîîòâåòñòâóþùèõ èì ïîìå÷åííûõ ãðàôîâ, ìèíóÿ ñòàäèþ ïðîèçâîëüíîãî âûáîðà ìîëåêóëÿðíûõ äåñêðèïòîðîâ [13]. ÈÍÑ òàêîãî ñòðîåíèÿ áûëà óñïåøíî ïðèìåíåíà íàìè äëÿ ïðîãíîçèðîâàíèÿ òåìïåðàòóðû êèïåíèÿ àëêàíîâ, âÿçêîñòè, ïëîòíîñòè è òåïëîòû èñïàðåíèÿ óãëåâîäîðîäîâ, òåïëîòû ñîëüâàòàöèè è ïîëÿðèçóåìîñòè ïðîèçâîëüíûõ îðãàíè÷åñêèõ ñîåäèíåíèé, à òàêæå äàâëåíèÿ ðàçëè÷íûõ ãàçîâ, äîñòàòî÷íîãî äëÿ ïðîÿâëåíèÿ àíåñòåçèðóþùåãî ýôôåêòà [14].  ïîñëåäíèå ãîäû äëÿ ïðîãíîçèðîâàíèÿ áèîëîãè÷åñêîé àêòèâíîñòè õèìè÷åñêèõ ñîåäèíåíèé è ñîçäàíèÿ íîâûõ ëåêàðñòâåííûõ ïðåïàðàòîâ âñå áîëåå øèðîêî ïðèìåíÿþòñÿ ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5 ïîäõîäû, îñíîâàííûå íà ñâîéñòâàõ ñàìîîðãàíèçóþùåéñÿ ñåòè Êîõîíåíà.  îäíîì èç èñïîëüçóåìûõ ïðè ýòîì ïîäõîäîâ èñïîëüçóþò ñåòü Êîõîíåíà íèçêîãî ðàçðåøåíèÿ äëÿ îòîáðàæåíèÿ ñîçäàâàåìîãî âîêðóã ìîëåêóëû ýëåêòðîñòàòè÷åñêîãî ïîòåíöèàëà íà ïëîñêîñòü. Ïðè ýòîì îêàçûâàåòñÿ, ÷òî ìîëåêóëû ñîâåðøåííî ðàçíîãî ñòðîåíèÿ, íî äåéñòâóþùèå íà îäíó è òó æå áèîëîãè÷åñêóþ ìèøåíü (íàïðèìåð, ðåöåïòîð èëè ôåðìåíò), äàþò ñõîäíîå îòîáðàæåíèå, ÷òî ïîçâîëÿåò ïðåäñêàçûâàòü áèîëîãè÷åñêóþ àêòèâíîñòü ìîëåêóë íà êà÷åñòâåííîì óðîâíå [15]. Äðóãîé íå ìåíåå ïåðñïåêòèâíûé ïîäõîä âêëþ÷àåò çàäàíèå êðèòåðèÿ «áëèçîñòè» õèìè÷åñêèõ ñòðóêòóð è èñïîëüçîâàíèå ýòîãî êðèòåðèÿ äëÿ îòîáðàæåíèÿ ëèáî áîëüøèõ áàç ïîòåíöèàëüíî âîçìîæíûõ áèîëîãè÷åñêè àêòèâíûõ ñîåäèíåíèé, ëèáî ñïåöèàëüíî ñêîíñòðóèðîâàííûõ êîìáèíàòîðíûõ áèáëèîòåê õèìè÷åñêèõ ñîåäèíåíèé («ïåðâàÿ áàçà») íà óçëû äâóìåðíîé ðåøåòêè ïðè ïîìîùè ñåòåé Êîõîíåíà âûñîêîãî ðàçðåøåíèÿ [16]. Ïîñëå ýòîãî îáó÷åííàÿ òàêèì îáðàçîì ÈÍÑ èñïîëüçóåòñÿ äëÿ îòîáðàæåíèÿ ìíîæåñòâà õèìè÷åñêèõ ñîåäèíåíèé, îáëàäàþùèõ çàäàííîé áèîëîãè÷åñêîé (íàïðèìåð, ôàðìàêîëîãè÷åñêîé) àêòèâíîñòüþ («âòîðàÿ áàçà»), íà ýòó æå ðåøåòêó íåéðîíîâ. Âñëåä çà ýòèì ñîåäèíåíèÿ èç «ïåðâîé áàçû», îòîáðàçèâøèåñÿ íà òå æå óçëû, ÷òî è ñîåäèíåíèÿ «âòîðîé áàçû», âûáèðàþòñÿ äëÿ äàëüíåéøåãî èññëåäîâàíèÿ êàê ïîòåíöèàëüíî àêòèâíûå ñîåäèíåíèÿ. Íàêîíåö, òðåòèé ïîäõîä ê èñïîëüçîâàíèþ ñåòåé Êîõîíåíà [17] (à òàêæå ñåòåé ART-2 [18]) â ýòîé îáëàñòè âêëþ÷àåò èõ èñïîëüçîâàíèå äëÿ êëàñòåðèçàöèè áàç äàííûõ ñ öåëüþ èõ ðàçáèâêè íà îáó÷àþùóþ è êîíòðîëüíóþ âûáîðêè. Êðîìå ïðîãíîçèðîâàíèÿ ôèçèêî-õèìè÷åñêèõ ñâîéñòâ îðãàíè÷åñêèõ ñîåäèíåíèé è èõ áèîëîãè÷åñêîé àêòèâíîñòè ÈÍÑ ïðèìåíÿþò òàêæå è äëÿ ïðåäñêàçàíèÿ ñïåêòðîâ. Âîçìîæíîñòü ïðåäñêàçàòü ñïåêòð ïîçâîëÿåò, âî-ïåðâûõ, îñóùåñòâëÿòü èäåíòèôèêàöèþ õèìè÷åñêèõ ñîåäèíåíèé, ÷òî êðàéíå âàæíî, íàïðèìåð, äëÿ ýêîëîãè÷åñêîãî êîíòðîëÿ, è ïîëó÷åíèÿ íîâûõ õèìè÷åñêèõ ñîåäèíåíèé ñ çàäàííûìè ñïåêòðàëüíûìè ñâîéñòâàìè (íàïðèìåð, ñ öåëüþ ñîçäàíèÿ íîâûõ ëàçåðíûõ êðàñèòåëåé). Ïðè ïðîãíîçèðîâàíèè ìàññ-ñïåêòðîâ [19, 20] è ñïåêòðîâ ïîãëîùåíèÿ ñâåòà â èíôðàêðàñíîé îáëàñòè [20–22] â êà÷åñòâå âõîäíîãî íàáîðà äåñêðèïòîðîâ èñïîëüçóþò îáû÷íî ïðèçíàêè íàëè÷èÿ îïðåäåëåííîé ïîäñòðóêòóðû â ñîñòàâå õèìè÷åñêîé ñòðóêòóðû, ïðè ýòîì â ðÿäå ñëó÷àåâ õîðîøî ñåáÿ çàðåêîìåíäîâàëî èñïîëüçîâàíèå êîìáèíèðîâàííîé ñåòè, ñîñòîÿùåé èç ìíîæåñòâà ïðîñòûõ ÈÍÑ. Ïðè ïðîãíîçèðîâàíèè ñïåêòðîâ ÿäåðíîãî ìàãíèòíîãî è ýëåêòðîííîãî ïàðàìàãíèòíîãî ðåçîíàíñà â êà÷åñòâå âåêòîðîâ äåñêðèïòîðîâ èñïîëüçóþò ëèáî, êàê è â ïðåäûäóùåì ñëó÷àå, ôîðìàëüíî-ñòðóêòóðíûå ïàðàìåòðû, ëèáî ðåçóëüòàòû êâàíòîâîìåõàíè÷åñêèõ ðàñ÷åòîâ [23]. Ñëåäóåò, îäíàêî, óïîìÿíóòü ðàáîòû, â êîòîðûõ ýòè ñïåêòðû ïðîãíîçèðîâàëèñü áåç èñïîëüçîâàíèÿ âõîäíîãî âåêòîðà äåñêðèïòîðîâ çà ñ÷åò ââåäåíèÿ èíôîðìàöèè î õèìè÷åñêîé ñòðóêòóðå íåïîñðåäñòâåííî â ÈÍÑ [24]. Íàêîíåö, ïðè ïðîãíîçèðîâàíèè ñïåêòðîâ ïîãëîùåíèÿ â óëüòðàôèîëåòîâîé è âèäèìîé îáëàñòÿõ ïðè ïîìîùè ÈÍÑ õîðîøî ñåáÿ çàðåêîìåíäîâàëî, êàê ìû ïîêàçàëè â îäíîé èç ðàáîò íà ïðèìåðå äëèííîâîëíîâûõ ïîëîñ ïîãëîùåíèÿ öèàíèíîâûõ êðàñèòåëåé, ñî÷åòàíèå êâàíòîâîìåõà- 325 íè÷åñêèõ è ôîðìàëüíî-ñòðóêòóðíûõ äåñêðèïòîðîâ [25]. Êðîìå ïðîãíîçèðîâàíèÿ ñâîéñòâ îðãàíè÷åñêèõ ñîåäèíåíèé è èõ ñïåêòðîâ ÈÍÑ èñïîëüçóþò òàêæå äëÿ ïîèñêà ìåòîäîâ èõ ñèíòåçà è ïðåäñêàçàíèÿ õèìè÷åñêîé ðåàêöèîííîé ñïîñîáíîñòè [26, 27].  ýòèõ ðàáîòàõ â êà÷åñòâå âõîäíîé èíôîðìàöèè äëÿ ÈÍÑ èñïîëüçóþòñÿ ëèáî ôîðìàëüíî-ñòðóêòóðíûå ïàðàìåòðû, ëèáî íåïîñðåäñòâåííî ìàòðèöà ñìåæíîñòè ìîëåêóëÿðíîãî ãðàôà, ñîîòâåòñòâóþùåãî õèìè÷åñêîìó ñîåäèíåíèþ, à â êà÷åñòâå âûõîäà íàïðàâëåíèå ëèáî ñèíòåòè÷åñêîé, ëèáî ðåòðîñèíòåòè÷åñêîé ðåàêöèè. Âî âñåõ ýòèõ ðàáîòàõ èñïîëüçîâàíà ñòàíäàðòíàÿ ÈÍÑ ñ ïðÿìîé ñâÿçüþ è ñ îáðàòíûì ðàñïðîñòðàíåíèåì îøèáêè. Åùå îäíèì íàïðàâëåíèåì ÿâëÿåòñÿ èñïîëüçîâàíèå ÈÍÑ â àíàëèòè÷åñêîé õèìèè äëÿ îïðåäåëåíèÿ õèìè÷åñêîãî ñîñòàâà àíàëèçèðóåìîé ñìåñè, ÷òî êðàéíå âàæíî äëÿ êîíòðîëÿ õèìè÷åñêîãî ïðîèçâîäñòâà è ýêîëîãè÷åñêîãî ìîíèòîðèíãà.  ýòîì ñëó÷àå ðàáîòà ìîæåò ïðîòåêàòü â äâóõ âàðèàíòàõ: äèíàìè÷åñêîì è ñòàòè÷åñêîì.  ïåðâîì ñëó÷àå èñïîëüçóþò ÈÍÑ, îáó÷åííóþ ïî çíà÷åíèþ ïîñòóïàþùèõ íà åå âõîä ñèãíàëîâ, ñíÿòûõ ñ äàò÷èêîâ (â êà÷åñòâå òàêèõ ñèãíàëîâ ìîãóò, íàïðèìåð, âûñòóïàòü ïîòåíöèàëû, ñíÿòûå ñ èîí-ñåëåêòèâíûõ ýëåêòðîäîâ èëè ñ ãàçîâûõ ñåíñîðîâ), âîñïðîèçâîäèòü ïðîöåíòíûé ñîñòàâ àíàëèçèðóåìîé ñìåñè [28, 29]. Âî âòîðîì ñëó÷àå ÈÍÑ ìîæåò áûòü îáó÷åíà, íàïðèìåð, ðàçëàãàòü ñïåêòð ñìåñè íà ñïåêòðû èíäèâèäóàëüíûõ êîìïîíåíòîâ [30]. Èç ðàáîò ïî ïðèìåíåíèþ ÈÍÑ â ôèçè÷åñêîé õèìèè íàèáîëåå èíòåðåñíû èññëåäîâàíèÿ, ñâÿçàííûå ñ ìîäåëèðîâàíèåì êèíåòèêè õèìè÷åñêèõ ïðîöåññîâ ñ èñïîëüçîâàíèåì ðåêóððåíòíûõ ñåòåé Õîïôèëäà. Áûëî ïîêàçàíî, ÷òî ìîäåëèðîâàíèå âîçìîæíî â äâóõ íàïðàâëåíèÿõ.  îäíîì ñëó÷àå ïðè ïîìîùè ÈÍÑ ìîæíî ìîäåëèðîâàòü ïðîòåêàíèå õèìè÷åñêèõ ðåàêöèé [31], à â äðóãîì ñ ïîìîùüþ ñïåöèàëüíî ïîäîáðàííîãî íàáîðà õèìè÷åñêèõ ðåàêöèé ìîäåëèðîâàòü äèíàìèêó ðàáîòû ðåêóððåíòíûõ íåéðîííûõ ñåòåé, ÷òî, â ñóùíîñòè, ýêâèâàëåíòíî ïðîâåäåíèþ âû÷èñëåíèé ïðè ïîìîùè «õèìè÷åñêîãî êîìïüþòåðà» [32]. Áîëüøîé èíòåðåñ âûçûâàåò òàêæå ìîäåëèðîâàíèå ãèïåðïîâåðõíîñòè ïîòåíöèàëüíîé ýíåðãèè ìîëåêóë ïðè ïîìîùè ÈÍÑ ñ ïðÿìûìè ñâÿçÿìè.  ýòîì ñëó÷àå ïîñëå ïîäà÷è íà âõîä îáó÷åííîé ÈÍÑ ñèãíàëîâ, îïèñûâàþùèõ ãåîìåòðèþ ìîëåêóëû, íà âûõîäíîì íåéðîíå ôîðìèðóåòñÿ ñèãíàë, ñîîòâåòñòâóþùèé ïîòåíöèàëüíîé ýíåðãèè ìîëåêóëû. Îáó÷åííûå òàêèì îáðàçîì ÈÍÑ ìîãóò áûòü â äàëüíåéøåì èñïîëüçîâàíû äëÿ ìîäåëèðîâàíèÿ äèíàìè÷åñêèõ ñâîéñòâ ìîëåêóë è ìîëåêóëÿðíûõ ñèñòåì [33–35]. Íàêîíåö, ñëåäóåò îòìåòèòü, ÷òî îäíèì èç íàèáîëåå âàæíûõ íàïðàâëåíèé ïðèìåíåíèÿ ÈÍÑ â îáëàñòÿõ, ñìåæíûõ ñ õèìèåé, ÿâëÿåòñÿ èõ èñïîëüçîâàíèå â áèîõèìèè è ñòðóêòóðíîé ìîëåêóëÿðíîé áèîëîãèè. Íàèáîëåå âàæíûì ïðèìåíåíèåì ÈÍÑ â ýòîé îáëàñòè ÿâëÿåòñÿ ïðîãíîçèðîâàíèå âòîðè÷íîé ñòðóêòóðû áåëêà ïî åãî ïåðâè÷íîé àìèíîêèñëîòíîé ïîñëåäîâàòåëüíîñòè [36, 37]). Àêòóàëüíîñòü ýòîé çàäà÷è îïðåäåëÿåòñÿ òåì, ÷òî çíàíèå ïðîñòðàíñòâåííîé ñòðóêòóðû áåëêà êðàéíå âàæíî äëÿ âîçìîæíîñòè ïðîâîäèòü öåëåíàïðàâëåííîå ñîçäàíèå íîâûõ ëåêàðñòâåííûõ ïðåïàðàòîâ, ìåõàíèçì äåéñòâèÿ êîòîðûõ çàêëþ÷àåòñÿ â ñâÿçûâàíèè ñ ýòèì 326 áåëêîì.  ýòîì ñëó÷àå â êà÷åñòâå âõîäíûõ ñèãíàëîâ ìîæíî èñïîëüçîâàòü ñâîéñòâà àìèíîêèñëîò, íàõîäÿùèõñÿ ðÿäîì ñ òåêóùåé àìèíîêèñëîòîé. Âûõîäíîé ñèãíàë äàåò èíôîðìàöèþ î êëàññèôèêàöèè êîíôîðìàöèè îñíîâíîé öåïè àìèíîêèñëîòû íà òèïû, ñîîòâåòñòâóþùèå âòîðè÷íîé ñòðóêòóðå áåëêà (α-ñïèðàëü, β-ñëîé è ò.ä.). Äëÿ ýòîé öåëè, êàê ïðàâèëî, èñïîëüçóåòñÿ ñòàíäàðòíàÿ ÈÍÑ ñ ïðÿìûìè ñâÿçÿìè è îáðàòíûì ðàñïðîñòðàíåíèåì îøèáîê ïðè îáó÷åíèè. Åùå áîëüøèé èíòåðåñ ïðåäñòàâëÿþò ðàáîòû ïî ïðîãíîçèðîâàíèþ òðåòè÷íîé ñòðóêòóðû áåëêà èñõîäÿ èç åãî ïåðâè÷íîé àìèíîêèñëîòíîé ïîñëåäîâàòåëüíîñòè [38, 39], îäíàêî â ýòîì ñëó÷àå äîñòèãíóòûå óñïåõè íå òàê çíà- ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5 ÷èòåëüíû, êàê ïðè ïðîãíîçèðîâàíèè âòîðè÷íîé ñòðóêòóðû áåëêà. Äðóãèì íàïðàâëåíèåì ïðèìåíåíèÿ ÈÍÑ â ìîëåêóëÿðíîé áèîëîãèè ÿâëÿåòñÿ àíàëèç ãåíåòè÷åñêîé ïîñëåäîâàòåëüíîñòè è ðàñïîçíàâàíèå âàæíûõ ó÷àñòêîâ ãåíîâ, íàïðèìåð ïðîìîòîðîâ èõ ýêñïðåññèè, ó÷àñòêîâ êîäèðîâàíèÿ áåëêîâ, ó÷àñòêîâ ñâÿçûâàíèÿ ñ áåëêàìè, à òàêæå âûäåëåíèå ñêðûòûõ ïåðèîäè÷íîñòåé (ìîòèâîâ) [40–43]. ÈÍÑ òàêæå èñïîëüçóþòñÿ äëÿ ïðîãíîçèðîâàíèÿ ìåñò ñâÿçûâàíèÿ â áåëêàõ ñ íóêëåèíîâûìè êèñëîòàìè, äðóãèìè áåëêàìè èëè ñ íèçêîìîëåêóëÿðíûìè ëèãàíäàìè [44, 45]. Ðåçóëüòàòû ïîäîáíûõ ïðîãíîçîâ ìîãóò áûòü â äàëüíåéøåì èñïîëüçîâàíû ïðè ðàçðàáîòêå íîâûõ ýôôåêòèâíûõ ëåêàðñòâåííûõ ñðåäñòâ. ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ 1. Ãîðáàíü À.Í., Ðîññèåâ Ä.À. Íåéðîííûå ñåòè íà ïåðñîíàëüíîì êîìïüþòåðå. Íîâîñèáèðñê, 1996. 2. Åæîâ À.À., Øóìñêèé Ñ.À. Íåéðîêîìïüþòèíã è åãî ïðèìåíåíèå â ýêîíîìèêå è áèçíåñå. Ì., 1998. 3. Zupan J., Gasteiger J. Neural Networks for Chemists - An Introduction. Weinhem, 1993. 4. Gasteiger J, Zupan J. // Neural Networks in Chemistry, Angew. Chem. Int. Ed. Engl. 1993. 105. ¹ 4. Ð. 503. 5. Neural Networks in QSAR and Drug Design / Ed. J. Devillers. L., 1996. 6. Áàñêèí È.È., Ãàëüáåðøòàì Í.Ì., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ. // Èíôîðìàöèîííûå òåõíîëîãèè. 1997. ¹ 9. C. 27. 7. Áàñêèí È.È., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ. // Íåéðîêîìïüþòåð. 1997. ¹3/4. C. 17. 8. Baskin I.I., Skvortsova M.I., Palyulin V.A., Zefirov N.S. // Foundations of Computing and Decision Sciences. 1997. 22. ¹ 2. P. 107. 9. Tetko I.V., Villa A.E.P., Livingstone D.J. // J. Chem. Inf. Comput. Sci. 1996. 36. ¹ 4. P. 794. 10. Áàñêèí È.È., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ. // ÄÀÍ. 1993. 332. ¹ 6. C. 713. 11. Abilev S.K., Lyubimova I.K., Baskin I.I., Halberstam N.M. Palyulin V.A. // Karadeniz Journal of Medical Sciences 1995. 8. ¹ 4. P. 227. 12. Baskin I.I., Palyulin V.A., Zefirov N.S. 12th European Symposium on Quantitative Structure-Activity Relationships «Molecular Modelling and Prediction of Bioactivity», August 2328, 1998. Copenhagen, Denmark, P. 140. 13. Áàñêèí È.È., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ. // ÄÀÍ. 1993. 333. ¹ 2. C. 176. 14. Baskin I.I., Palyulin V.A., Zefirov N.S. // J. Chem. Inf. Comput. Sci. 1997. 37. ¹ 4. P. 715. 15. Holzgrabe U., Wagener M., Gasteiger J. // J. Mol. Graphics 1996. 14. ¹ 4. P. 185. 16. Kireev D.B., Ros F., Bernard P., Chretien J.R., Rozhkova N.I. Computer-Assisted Lead Finding and Optimization. Current Tools for Medicinal Chemistry. Wiley-VCH, 1997. P. 255. 17. Domine D., Devillers J., Wienke D., Buydens L. // Quant. Struct.Act. Relat. 1996. 15. ¹ 5. P. 395. 18. Domine D., Devillers J., Wienke D., Buydens L. // J. Chem. Inf. Comput. Sci. 1997. 37. ¹ 1. P. 10. 19. Curry B., Rumelhart D.E. // Tetrahedron Comput. Methodol. 1990. 3. P. 213. 20. Gasteiger J., Li X., Simon V., Novic M., Zupan J. // J. Mol. Struct. 1993. 292. P. 141. 21. Robb E.W., Munk M.E. // Mikrochim. Acta [Wien], 1990. Ð. 131. 22. Munk M.E., Madison M.S., Robb E.W. // Microchim. Acta [Wien] 1991. II. Ð. 505. 23. Thomsen J.U., Mayer B. // J. Magn. Res. 1989. 84. P. 212. 24. Kvasnicka V. // J. Math. Chem. 1991. 6. P. 63. 25. Áàñêèí È.È., Àéò À.Î., Ãàëüáåðøòàì Í.Ì., Ïàëþëèí Â.À., Àëôèìîâ Ì.Â., Çåôèðîâ Í.Ñ. // ÄÀÍ. 1997. 357. ¹ 1. C. 57. 26. Elrod D.W., Maggiora G.M., Trenary R.G. // J. Chem. Inf. Comput. Sci. 1990. 30. P. 477. 27. Elrod D.W., Maggiora G.M., Trenary R.G. // Tetrahedron Comput. Methodol. 1990. 3. P. 163. 28. Bos M., Bas A., Van-der-Linden W.E. // Anal. Chim. Acta. 1990. 233. ¹ 1. P. 31. 29. Sundgren H., Winquist F., Lukkarl I., Lundstroem I. // Meas. Sci. Technol. 1991. 2. P. 464. 30. Wythoff B.J., Levine S.P., Tomellini S.A. // Anal. Chem. 1990. 62. P. 2702. 31. Lebender D., Schneider F.W. // J. Phys. Chem. 1993. 97. ¹ 34. P. 8764. 32. Hjelmfelt A. Ross J. // Proc. Natl. Acad. Sci. U.S.A. 1992. 89. P. 398. 33. Blank T.B., Brown S.D., Calhoun A.W., Doren D.J. // J. Chem. Phys. 1995. 103. P. 4129. 34. Tafeit E., Estelberger W., Horejsi R., Moeller R., Oettl K., Vrecko K., Reibnegger G. // J. Mol. Graphics. 1996. 14. P. 12. 35. No K.T., Chang B.H., Kim S.Y., Jhon M.S., Scheraga H.A. /Chem. Phys. Lett. 1997. 271. P. 152. 36. Qian N., Sejnowski T.J. // J. Mol. Biol. 1988. 202. P. 865. 37. Bohr H., Bohr J., Brunak S., Cotterill R.M.J., Lautrup B., Norskov L., Olsen O.H., Petersen S.B. // FEBS Lett. 1988. P. 223. 38. Friedrichs M.S., Wolynes P.G. // Science. 1989. 246. P. 371. 39. Bohr H., Bohr J., Brunak S., Cotterill R.M.J., Fredholm F., Lautrup B., Olsen O.H., Petersen S.B. // FEBS Lett. 1990. 261. P. 43. 40. Brunak S., Engelbrecht J., Knudsen S. // J. Mol. Biol. 1991. 220. ¹ 1. P. 49. 41. Ezhov A.A., Kalambet Yu.A., Cherny D.I. // Stud. Biophys. 1989. 129. P. 183. 42. Åæîâ À.À., Òîêàåâ À.Ã., ×å÷åòêèí Â.Ð. // Íàó÷íàÿ ñåññèÿ ÌÈÔÈ 99. Âñåðîññèéñêàÿ íàó÷íî-òåõíè÷åñêàÿ êîíôåðåíöèÿ «Íåéðîèíôîðìàòèêà-99»: Ñáîðíèê íàó÷íûõ òðóäîâ. ×. 3. Ì., 1999. Ñ. 182. 43. Ïðîõîðîâ Ð.Â. // Íàó÷íàÿ ñåññèÿ ÌÈÔÈ 99. Âñåðîññèéñêàÿ íàó÷íî-òåõíè÷åñêàÿ êîíôåðåíöèÿ «Íåéðîèíôîðìàòèêà-99». Ñáîðíèê íàó÷íûõ òðóäîâ. ×. 3. Ì., 1999. Ñ. 204. 44. Hirst J.D., Sternberg M.J. // Protein Eng. 1991. 4. ¹ 6. P. 615. 45. Hirst J.D., Sternberg, M.J.E. // Biochemistry. 1992. 31. ¹ 32. P. 7211. Ïîñòóïèëà â ðåäàêöèþ 23.04.99