применение искусственных нейронных сетей в химических

реклама
ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5
323
ÓÄÊ 541.6
ÏÐÈÌÅÍÅÍÈÅ ÈÑÊÓÑÑÒÂÅÍÍÛÕ ÍÅÉÐÎÍÍÛÕ ÑÅÒÅÉ
 ÕÈÌÈ×ÅÑÊÈÕ È ÁÈÎÕÈÌÈ×ÅÑÊÈÕ ÈÑÑËÅÄÎÂÀÍÈßÕ
È. È. Áàñêèí, Â. À. Ïàëþëèí, Í. Ñ. Çåôèðîâ
(êàôåäðà îðãàíè÷åñêîé õèìèè)
 ñòàòüå ðàññìîòðåíû îñíîâíûå íàïðàâëåíèÿ ïðèìåíåíèÿ èñêóññòâåííûõ íåéðîííûõ ñåòåé â
õèìè÷åñêèõ è áèîõèìè÷åñêèõ èññëåäîâàíèÿõ. Íàèáîëüøåå âíèìàíèå óäåëåíî ðàáîòàì ïî êîððåëÿöèÿì ìåæäó ñòðîåíèåì õèìè÷åñêèõ ñîåäèíåíèé è ïðîÿâëÿåìûìè èìè ôèçèêî-õèìè÷åñêèìè ñâîéñòâàìè è áèîëîãè÷åñêîé àêòèâíîñòüþ, êîòîðûå îòêðûâàþò âîçìîæíîñòü èñïîëüçîâàíèÿ íåéðîñåòè äëÿ äèçàéíà ìàòåðèàëîâ ñ çàðàíåå çàäàííûìè ñâîéñòâàìè è íîâûõ ôàðìàêîëîãè÷åñêèõ ïðåïàðàòîâ. Ñôîðìóëèðîâàíû îñíîâíûå íàïðàâëåíèÿ ðàáîò ïî ïðèìåíåíèþ
èñêóññòâåííûõ íåéðîííûõ ñåòåé â îðãàíè÷åñêîé, àíàëèòè÷åñêîé, ôèçè÷åñêîé è áèîëîãè÷åñêîé îáëàñòÿõ õèìèè.
 íàñòîÿùåå âðåìÿ â âû÷èñëèòåëüíîé ìàòåìàòèêå è
ïðàêòè÷åñêè âî âñåõ ñâÿçàííûõ ñ íåé íàó÷íûõ è òåõíè÷åñêèõ äèñöèïëèíàõ ïðîèñõîäÿò êîðåííûå èçìåíåíèÿ â ïîíèìàíèè ïðèíöèïîâ îðãàíèçàöèè âû÷èñëèòåëüíîãî ïðîöåññà
è ïîäõîäîâ ê ðåøåíèþ ïðèêëàäíûõ çàäà÷, ÷òî âûçâàíî çíà÷èòåëüíûì ðîñòîì èíòåðåñà ê òåîðèè è ïðàêòèêå èñïîëüçîâàíèÿ èñêóññòâåííûõ íåéðîííûõ ñåòåé (ÈÍÑ). Ýòî óæå
ïðèâåëî ê ïîÿâëåíèþ íîâûõ íàó÷íûõ äèñöèïëèí, òàêèõ êàê
íåéðîèíôîðìàòèêà, íåéðîêîìïüþòèíã è íåéðîìàòåìàòèêà
[1, 2]. Ïîÿâèâøèñü îòíîñèòåëüíî íåäàâíî êàê îäíî èç íàïðàâëåíèé â îáëàñòè èñêóññòâåííîãî èíòåëëåêòà, ïðèçâàííîå ìîäåëèðîâàòü íà êîìïüþòåðå ïðîöåññû îáðàáîòêè èíôîðìàöèè, ïðîèñõîäÿùèå â ÷åëîâå÷åñêîì ìîçãó, ÈÍÑ óòâåðäèëè ñåáÿ â êà÷åñòâå âåäóùåãî íàïðàâëåíèÿ ðàçâèòèÿ
âû÷èñëèòåëüíîé ìàòåìàòèêè, ïðåâçîéäÿ ïî ÷èñëó ïóáëèêàöèé âñå îñòàëüíûå íàïðàâëåíèÿ, âìåñòå âçÿòûå.
Ïðè÷èíà òàêîãî áåñïðåöåäåíòíîãî ðîñòà èíòåðåñà ê
ÈÍÑ êðîåòñÿ â èçíà÷àëüíî ïðèñóùåé èì ñïîñîáíîñòè
ïîäõîäèòü ê îáðàáîòêå èíôîðìàöèè êàê ê ïðîöåññó ðàñïîçíàâàíèÿ è êëàññèôèêàöèè îáðàçîâ ñîâåðøåííî ïðîèçâîëüíîé è ñêîëü óãîäíî ñëîæíîé ñòðóêòóðû ïðè ïîìîùè
íåôîðìàëèçóåìûõ àëãîðèòìîâ, êîòîðûå ñàìè æå íåéðîííûå ñåòè è íàõîäÿò. Ýòî âûãîäíî îòëè÷àåò èõ îò òðàäèöèîííûõ ñïîñîáîâ êîìïüþòåðíîé îáðàáîòêè èíôîðìàöèè
ïðè ïîìîùè îïåðàöèé ñ ÷èñëàìè è ñèìâîëàìè, çàðàíåå
ñïåöèôèöèðîâàííûõ ïî êàêîìó-ëèáî æåñòêîìó àëãîðèòìó.
Ýëåìåíòàðíîé åäèíèöåé îáðàáàòûâàåìîé èíôîðìàöèè â
ÈÍÑ ÿâëÿåòñÿ îáðàç ïðîèçâîëüíîé äëèíû, îáû÷íî ïðåäñòàâëÿåìûé â âèäå ëèáî îäíîìåðíîãî âåêòîðà, ëèáî äâóìåðíîé ìàòðèöû ÷èñåë, à ýëåìåíòàðíîé îïåðàöèåé – ñðàáàòûâàíèå èñêóññòâåííîãî íåéðîíà (ðèñ. 1), â ïðîöåññå
êîòîðîãî ïðîèñõîäèò ñðàâíåíèå âíåøíåãî îáðàçà ñ õðàíÿùèìñÿ â ñâÿçàííûõ ñ íåéðîíîì ñèíàïñàõ ýòàëîíîì
ïóòåì âû÷èñëåíèÿ ñêàëÿðíîãî ïðîèçâåäåíèÿ âåêòîðà
îáðàçà è âåêòîðà ñèíàïòè÷åñêèõ âåñîâ, âñëåä çà ÷åì
íåéðîí ðåàãèðóåò íà òàêîå ñðàâíåíèå ïóòåì âçÿòèÿ ñïåöèàëüíîé ôóíêöèè àêòèâàöèè îò ýòîãî ñêàëÿðíîãî ïðîèçâåäåíèÿ. Ïðè ýòîì ôîðìèðóåòñÿ ñèãíàë, âõîäÿùèé â
ñîñòàâ íîâûõ îáðàçîâ, ïîäàþùèõñÿ íà âõîä óæå äðóãèì
íåéðîíàì ñåòè. Ïîñêîëüêó âñëåäñòâèå «êîìáèíàòîðíîãî
âçðûâà» äëÿ ïðîèçâîëüíûõ îáðàçîâ ïðèíöèïèàëüíî íåâîçìîæíî ïîëíîñòüþ îïèñàòü ïðîèçâîëüíûé àëãîðèòì
èõ îáðàáîòêè, òî ÈÍÑ ðåøàþò ýòó çàäà÷ó äðóãèì ñïîñîáîì: îíè ïûòàþòñÿ âîññòàíîâèòü àëãîðèòì ïî åãî íåïîëíîìó îïèñàíèþ, çàäàííîìó â âèäå íàáîðà ïðèìåðîâ. Èíûìè ñëîâàìè, â îñíîâå ðàáîòû ÈÍÑ ëåæèò èñïîëüçîâàíèå àëãîðèòìîâ, ïîëó÷àåìûõ ïðè ïîìîùè
îáó÷åíèÿ íà ïðèìåðàõ. Ýòè àëãîðèòìû êîäèðóþòñÿ â
ÈÍÑ â âèäå çíà÷åíèé âåñîâ ñèíàïñîâ. Îáó÷åííàÿ òàêèì
îáðàçîì ÈÍÑ ñïîñîáíà ðåøàòü çàäà÷ó àïïðîêñèìàöèè
íåëèíåéíîé ôóíêöèè ïðîèçâîëüíîãî âèäà îò ìíîãèõ ïåðåìåííûõ è, êàê ÷àñòíûé ñëó÷àé ýòîãî, çàäà÷ó îòíåñåíèÿ
îáðàçîâ ê îäíîìó èç êëàññîâ, à òàêæå çàäà÷ó êàòåãîðèçàöèè äàííûõ è îïðåäåëåíèÿ èõ âíóòðåííåé ñòðóêòóðû.
ÈÍÑ ðàçíîãî ñòðîåíèÿ ïî-ðàçíîìó îðèåíòèðîâàíû íà ðåøåíèå ýòèõ çàäà÷.
Äëÿ ðåøåíèÿ ïåðâîé çàäà÷è îáû÷íî ïðèìåíÿþò ñåòè
ïðÿìûõ ñâÿçåé (feed-forward) (ðèñ. 2), îáó÷àåìûå ïðè ïîìîùè àëãîðèòìà îáðàòíîãî ðàñïðîñòðàíåíèÿ îøèáîê
(backpropagation), íî èñïîëüçóþòñÿ òàêæå ñåòè âñòðå÷íîãî ðàñïðîñòðàíåíèÿ (counterpropagation), à òàêæå ñåòè
ðàäèàëüíûõ ãàóññîâûõ ôóíêöèé RBF, êàñêàäíûå ñåòè êîððåëÿöèé (cascade correlation networks) è ñåòè ôóíêöèîíàëüíûõ ñâÿçåé (functional links networks). Äëÿ ðåøåíèÿ
âòîðîé çàäà÷è ÷àùå ïðèìåíÿþò ñåòè Õîïôèëäà (Hopfield)
è ñåòè àäàïòèâíîãî ðåçîíàíñà ART, òîãäà êàê äëÿ ðåøåíèÿ
òðåòüåé çàäà÷è îáû÷íî èñïîëüçóþò ñàìîîðãàíèçóþùèåñÿ
Ðèñ. 1. Ñõåìà ðàáîòû íåéðîíà
324
êàðòû Êîõîíåíà (Kohonen). Êðîìå òîãî, ÈÍÑ ìîãóò áûòü
èñïîëüçîâàíû äëÿ èçâëå÷åíèÿ ÿâíûõ çíàíèé èç íàáîðà
äàííûõ (data mining). Äëÿ ýòèõ öåëåé ñëóæàò ñïåöèàëüíûå
ïðîöåäóðû ïðîðåæèâàíèÿ, óïðîùåíèÿ è «âåðáàëèçàöèè»
íåéðîííûõ ñåòåé [1, 2]). ÈÍÑ ìîãóò áûòü ðåàëèçîâàíû ñ
ïîìîùüþ êàê íåéðîêîìïüþòåðîâ, òàê è ýìóëÿòîðîâ íåéðîííûõ ñåòåé íà êîìïüþòåðàõ îáû÷íîé àðõèòåêòóðû.
 ïîñëåäíèå ãîäû ÈÍÑ íàõîäÿò âñå áîëåå øèðîêîå
ïðèìåíåíèå ïðè ðàçðàáîòêå íîâûõ õèìè÷åñêèõ ñîåäèíåíèé è ìàòåðèàëîâ ñ çàðàíåå çàäàííûìè ñâîéñòâàìè
(áèáëèîãðàôèþ ïî ïðèìåíåíèþ ÈÍÑ â èçó÷åíèè ñâÿçè
õèìè÷åñêàÿ ñòðóêòóðà – ñâîéñòâî è õèìè÷åñêàÿ ñòðóêòóðà – áèîëîãè÷åñêàÿ àêòèâíîñòü ìîæíî íàéòè â êîìïüþòåðíîé ñåòè Èíòåðíåò ïî àäðåñó http://org.chem.msu.su/
~baskin/neurchem.html), à òàêæå ïðè ñîçäàíèè íîâûõ ëåêàðñòâåííûõ ïðåïàðàòîâ [3–7]. Ïîäîáíûå ïîäõîäû îáû÷íî
îñíîâàíû íà ñâîéñòâàõ ÈÍÑ ðàñïîçíàâàòü ñëîæíûå îáðàçû è àïïðîêñèìèðîâàòü íåïðåðûâíûå ôóíêöèè ïðîèçâîëüíîãî âèäà. Äëÿ ýòîãî íàèáîëåå ÷àñòî èñïîëüçóþò ìåòîäèêè, âêëþ÷àþùèå ïðåäâàðèòåëüíûé ïåðåâîä èíôîðìàöèè î ñâÿçíîñòè ìîëåêóëÿðíîãî ãðàôà, îäíîçíà÷íî îïèñûâàþùåãî ñòðîåíèå õèìè÷åñêîãî ñîåäèíåíèÿ, â âåêòîð
èíâàðèàíòîâ ãðàôà, íàçûâàåìûõ ìîëåêóëÿðíûìè äåñêðèïòîðàìè.  äàëüíåéøåì âåêòîðû ìîëåêóëÿðíûõ äåñêðèïòîðîâ, âû÷èñëåííûå äëÿ ñòðóêòóð õèìè÷åñêèõ ñîåäèíåíèé ñ
èçâåñòíûìè ñâîéñòâàìè, âìåñòå ñ ïðèñîåäèíåííûìè çíà÷åíèÿìè ñâîéñòâ èñïîëüçóþò â êà÷åñòâå ìíîæåñòâà ïðèìåðîâ äëÿ îáó÷åíèÿ ÈÍÑ êîððåêòíî âîñïðîèçâîäèòü çíà÷åíèå ïðîãíîçèðóåìîãî ñâîéñòâà èñõîäÿ èç ïîäàâàåìîãî íà âõîä ÈÍÑ âåêòîðà ìîëåêóëÿðíûõ äåñêðèïòîðîâ
(ðèñ. 3). Äëÿ ýòîé öåëè èñïîëüçóþò, êàê ïðàâèëî, ìíîãîñëîéíûå ÈÍÑ ñ ïðÿìûìè ñâÿçÿìè (feed-forward), îáó÷àåìûå ïî ìåòîäó îáðàòíîãî ðàñïðîñòðàíåíèÿ îøèáîê
(backpropagation), õîòÿ â ðÿäå ðàáîò óñïåøíî èñïîëüçîâàëè ÈÍÑ äðóãèõ òèïîâ, íàïðèìåð ñåòè âñòðå÷íîãî
ðàñïðîñòðàíåíèÿ (counterpropagation), ãàóññîâû ñåòè,
ñåòè êàñêàäíûõ êîððåëÿöèé (cascade correlation) è ñåòè
ôóíêöèîíàëüíûõ ñâÿçåé.  ïðîöåññå îáó÷åíèÿ îñóùåñòâëÿåòñÿ êîíòðîëü çà ïðîãíîçèðóþùåé ñïîñîáíîñòüþ ÈÍÑ
ïðè ïîìîùè çàðàíåå âûáðàííîé êîíòðîëüíîé âûáîðêè
Ðèñ. 2. Ñòðîåíèå ìíîãîñëîéíîé èñêóññòâåííîé íåéðîííîé ñåòè ñ
ïðÿìûìè ñâÿçÿìè
ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5
Ðèñ. 3. Ñõåìà èñïîëüçîâàíèÿ èñêóññòâåííîé íåéðîííîé ñåòè äëÿ
ïðîãíîçèðîâàíèÿ ñâîéñòâ õèìè÷åñêèõ ñîåäèíåíèé
ïðèìåðîâ, ÷òî ïîçâîëÿåò èçáåæàòü ïåðåîáó÷åíèÿ (íàìè
áûëî ïîêàçàíî, ÷òî íàèáîëåå îáúåêòèâíûå îöåíêè ïðîãíîçèðóþùåé ñïîñîáíîñòè ÈÍÑ ïðè ïðåæäåâðåìåííîì
ïðåðûâàíèè îáó÷åíèÿ äàåò èñïîëüçîâàíèå äâóõ êîíòðîëüíûõ âûáîðîê [8]). Êðîìå òîãî, âî ìíîãèõ ñëó÷àÿõ ïðè
îáó÷åíèè ïðèìåíÿþòñÿ ðàçëè÷íûå âèäû ðåãóëÿðèçàöèè
ñåòè è ïðóíèíãà (÷àñòè÷íîãî óäàëåíèÿ íåíóæíûõ íåéðîíîâ è ðàçðåæåíèÿ ñâÿçåé ìåæäó íèìè) äëÿ óïðîùåíèÿ
ñòðóêòóðû ÈÍÑ, óìåíüøåíèÿ ÷èñëà íåîáõîäèìûõ ìîëåêóëÿðíûõ äåñêðèïòîðîâ, ñëåäñòâèåì ÷åãî ÿâëÿåòñÿ ïîâûøåíèå ïðîãíîçèðóþùåé ñïîñîáíîñòè ñåòè [8, 9].  äàëüíåéøåì îáó÷åííàÿ òàêèì îáðàçîì ÈÍÑ ìîæåò áûòü èñïîëüçîâàíà äëÿ ïðîãíîçèðîâàíèÿ ñâîéñòâ õèìè÷åñêèõ ñîåäèíåíèé ñ öåëüþ ïîèñêà òåõ èç íèõ, êîòîðûå óäîâëåòâîðÿþò
çàðàíåå çàäàííûì ïàðàìåòðàì.
 ðàìêàõ èçëîæåííîé âûøå ìåòîäîëîãèè ìû îäíè èç
ïåðâûõ ïðîâåëè ïðè ïîìîùè ÈÍÑ ðàáîòû ïî ïðîãíîçèðîâàíèþ òåìïåðàòóðû êèïåíèÿ, îêòàíîâîãî ÷èñëà, ìîëÿðíîãî îáúåìà, ìîëÿðíîé ðåôðàêöèè, òåïëîòû èñïàðåíèÿ, êðèòè÷åñêîãî äàâëåíèÿ è ïîâåðõíîñòíîãî íàòÿæåíèÿ
àëêàíîâ [10], ìóòàãåííîñòè ãåòåðîöèêëè÷åñêèõ àíàëîãîâ
àðîìàòè÷åñêèõ óãëåâîäîðîäîâ [11], à òàêæå çíà÷åíèé êîíñòàíò çàìåñòèòåëåé [12].
 êà÷åñòâå àëüòåðíàòèâû ðàññìîòðåííîé âûøå ìåòîäîëîãèè, ïîäðàçóìåâàþùåé èñïîëüçîâàíèå ìîëåêóëÿðíûõ
äåñêðèïòîðîâ è ñòàíäàðòíûõ ÈÍÑ, áûëè ðàçðàáîòàíû è
óñïåøíî îïðîáîâàíû íà ïðàêòèêå ñåòè îñîáîãî ñòðîåíèÿ, ïîçâîëÿþùåãî îáó÷àòüñÿ çàâèñèìîñòè ñâîéñòâ õèìè÷åñêèõ ñîåäèíåíèé íåïîñðåäñòâåííî îò ñòðóêòóð ñîîòâåòñòâóþùèõ èì ïîìå÷åííûõ ãðàôîâ, ìèíóÿ ñòàäèþ ïðîèçâîëüíîãî âûáîðà ìîëåêóëÿðíûõ äåñêðèïòîðîâ [13]. ÈÍÑ
òàêîãî ñòðîåíèÿ áûëà óñïåøíî ïðèìåíåíà íàìè äëÿ ïðîãíîçèðîâàíèÿ òåìïåðàòóðû êèïåíèÿ àëêàíîâ, âÿçêîñòè,
ïëîòíîñòè è òåïëîòû èñïàðåíèÿ óãëåâîäîðîäîâ, òåïëîòû
ñîëüâàòàöèè è ïîëÿðèçóåìîñòè ïðîèçâîëüíûõ îðãàíè÷åñêèõ ñîåäèíåíèé, à òàêæå äàâëåíèÿ ðàçëè÷íûõ ãàçîâ, äîñòàòî÷íîãî äëÿ ïðîÿâëåíèÿ àíåñòåçèðóþùåãî ýôôåêòà [14].
 ïîñëåäíèå ãîäû äëÿ ïðîãíîçèðîâàíèÿ áèîëîãè÷åñêîé
àêòèâíîñòè õèìè÷åñêèõ ñîåäèíåíèé è ñîçäàíèÿ íîâûõ ëåêàðñòâåííûõ ïðåïàðàòîâ âñå áîëåå øèðîêî ïðèìåíÿþòñÿ
ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5
ïîäõîäû, îñíîâàííûå íà ñâîéñòâàõ ñàìîîðãàíèçóþùåéñÿ
ñåòè Êîõîíåíà. Â îäíîì èç èñïîëüçóåìûõ ïðè ýòîì ïîäõîäîâ èñïîëüçóþò ñåòü Êîõîíåíà íèçêîãî ðàçðåøåíèÿ äëÿ
îòîáðàæåíèÿ ñîçäàâàåìîãî âîêðóã ìîëåêóëû ýëåêòðîñòàòè÷åñêîãî ïîòåíöèàëà íà ïëîñêîñòü. Ïðè ýòîì îêàçûâàåòñÿ, ÷òî ìîëåêóëû ñîâåðøåííî ðàçíîãî ñòðîåíèÿ, íî äåéñòâóþùèå íà îäíó è òó æå áèîëîãè÷åñêóþ ìèøåíü (íàïðèìåð, ðåöåïòîð èëè ôåðìåíò), äàþò ñõîäíîå
îòîáðàæåíèå, ÷òî ïîçâîëÿåò ïðåäñêàçûâàòü áèîëîãè÷åñêóþ àêòèâíîñòü ìîëåêóë íà êà÷åñòâåííîì óðîâíå [15].
Äðóãîé íå ìåíåå ïåðñïåêòèâíûé ïîäõîä âêëþ÷àåò çàäàíèå
êðèòåðèÿ «áëèçîñòè» õèìè÷åñêèõ ñòðóêòóð è èñïîëüçîâàíèå ýòîãî êðèòåðèÿ äëÿ îòîáðàæåíèÿ ëèáî áîëüøèõ áàç
ïîòåíöèàëüíî âîçìîæíûõ áèîëîãè÷åñêè àêòèâíûõ ñîåäèíåíèé, ëèáî ñïåöèàëüíî ñêîíñòðóèðîâàííûõ êîìáèíàòîðíûõ áèáëèîòåê õèìè÷åñêèõ ñîåäèíåíèé («ïåðâàÿ áàçà») íà
óçëû äâóìåðíîé ðåøåòêè ïðè ïîìîùè ñåòåé Êîõîíåíà
âûñîêîãî ðàçðåøåíèÿ [16]. Ïîñëå ýòîãî îáó÷åííàÿ òàêèì
îáðàçîì ÈÍÑ èñïîëüçóåòñÿ äëÿ îòîáðàæåíèÿ ìíîæåñòâà
õèìè÷åñêèõ ñîåäèíåíèé, îáëàäàþùèõ çàäàííîé áèîëîãè÷åñêîé (íàïðèìåð, ôàðìàêîëîãè÷åñêîé) àêòèâíîñòüþ
(«âòîðàÿ áàçà»), íà ýòó æå ðåøåòêó íåéðîíîâ. Âñëåä çà
ýòèì ñîåäèíåíèÿ èç «ïåðâîé áàçû», îòîáðàçèâøèåñÿ íà
òå æå óçëû, ÷òî è ñîåäèíåíèÿ «âòîðîé áàçû», âûáèðàþòñÿ äëÿ äàëüíåéøåãî èññëåäîâàíèÿ êàê ïîòåíöèàëüíî àêòèâíûå ñîåäèíåíèÿ. Íàêîíåö, òðåòèé ïîäõîä ê èñïîëüçîâàíèþ
ñåòåé Êîõîíåíà [17] (à òàêæå ñåòåé ART-2 [18]) â ýòîé îáëàñòè âêëþ÷àåò èõ èñïîëüçîâàíèå äëÿ êëàñòåðèçàöèè áàç
äàííûõ ñ öåëüþ èõ ðàçáèâêè íà îáó÷àþùóþ è êîíòðîëüíóþ âûáîðêè.
Êðîìå ïðîãíîçèðîâàíèÿ ôèçèêî-õèìè÷åñêèõ ñâîéñòâ
îðãàíè÷åñêèõ ñîåäèíåíèé è èõ áèîëîãè÷åñêîé àêòèâíîñòè
ÈÍÑ ïðèìåíÿþò òàêæå è äëÿ ïðåäñêàçàíèÿ ñïåêòðîâ.
Âîçìîæíîñòü ïðåäñêàçàòü ñïåêòð ïîçâîëÿåò, âî-ïåðâûõ,
îñóùåñòâëÿòü èäåíòèôèêàöèþ õèìè÷åñêèõ ñîåäèíåíèé,
÷òî êðàéíå âàæíî, íàïðèìåð, äëÿ ýêîëîãè÷åñêîãî êîíòðîëÿ, è ïîëó÷åíèÿ íîâûõ õèìè÷åñêèõ ñîåäèíåíèé ñ çàäàííûìè ñïåêòðàëüíûìè ñâîéñòâàìè (íàïðèìåð, ñ öåëüþ ñîçäàíèÿ íîâûõ ëàçåðíûõ êðàñèòåëåé). Ïðè ïðîãíîçèðîâàíèè
ìàññ-ñïåêòðîâ [19, 20] è ñïåêòðîâ ïîãëîùåíèÿ ñâåòà â èíôðàêðàñíîé îáëàñòè [20–22] â êà÷åñòâå âõîäíîãî íàáîðà
äåñêðèïòîðîâ èñïîëüçóþò îáû÷íî ïðèçíàêè íàëè÷èÿ îïðåäåëåííîé ïîäñòðóêòóðû â ñîñòàâå õèìè÷åñêîé ñòðóêòóðû, ïðè ýòîì â ðÿäå ñëó÷àåâ õîðîøî ñåáÿ çàðåêîìåíäîâàëî èñïîëüçîâàíèå êîìáèíèðîâàííîé ñåòè, ñîñòîÿùåé èç
ìíîæåñòâà ïðîñòûõ ÈÍÑ. Ïðè ïðîãíîçèðîâàíèè ñïåêòðîâ
ÿäåðíîãî ìàãíèòíîãî è ýëåêòðîííîãî ïàðàìàãíèòíîãî ðåçîíàíñà â êà÷åñòâå âåêòîðîâ äåñêðèïòîðîâ èñïîëüçóþò
ëèáî, êàê è â ïðåäûäóùåì ñëó÷àå, ôîðìàëüíî-ñòðóêòóðíûå ïàðàìåòðû, ëèáî ðåçóëüòàòû êâàíòîâîìåõàíè÷åñêèõ
ðàñ÷åòîâ [23]. Ñëåäóåò, îäíàêî, óïîìÿíóòü ðàáîòû, â êîòîðûõ ýòè ñïåêòðû ïðîãíîçèðîâàëèñü áåç èñïîëüçîâàíèÿ
âõîäíîãî âåêòîðà äåñêðèïòîðîâ çà ñ÷åò ââåäåíèÿ èíôîðìàöèè î õèìè÷åñêîé ñòðóêòóðå íåïîñðåäñòâåííî â ÈÍÑ
[24]. Íàêîíåö, ïðè ïðîãíîçèðîâàíèè ñïåêòðîâ ïîãëîùåíèÿ
â óëüòðàôèîëåòîâîé è âèäèìîé îáëàñòÿõ ïðè ïîìîùè
ÈÍÑ õîðîøî ñåáÿ çàðåêîìåíäîâàëî, êàê ìû ïîêàçàëè â
îäíîé èç ðàáîò íà ïðèìåðå äëèííîâîëíîâûõ ïîëîñ ïîãëîùåíèÿ öèàíèíîâûõ êðàñèòåëåé, ñî÷åòàíèå êâàíòîâîìåõà-
325
íè÷åñêèõ è ôîðìàëüíî-ñòðóêòóðíûõ äåñêðèïòîðîâ [25].
Êðîìå ïðîãíîçèðîâàíèÿ ñâîéñòâ îðãàíè÷åñêèõ ñîåäèíåíèé è èõ ñïåêòðîâ ÈÍÑ èñïîëüçóþò òàêæå äëÿ ïîèñêà
ìåòîäîâ èõ ñèíòåçà è ïðåäñêàçàíèÿ õèìè÷åñêîé ðåàêöèîííîé ñïîñîáíîñòè [26, 27].  ýòèõ ðàáîòàõ â êà÷åñòâå
âõîäíîé èíôîðìàöèè äëÿ ÈÍÑ èñïîëüçóþòñÿ ëèáî ôîðìàëüíî-ñòðóêòóðíûå ïàðàìåòðû, ëèáî íåïîñðåäñòâåííî
ìàòðèöà ñìåæíîñòè ìîëåêóëÿðíîãî ãðàôà, ñîîòâåòñòâóþùåãî õèìè÷åñêîìó ñîåäèíåíèþ, à â êà÷åñòâå âûõîäà –
íàïðàâëåíèå ëèáî ñèíòåòè÷åñêîé, ëèáî ðåòðîñèíòåòè÷åñêîé ðåàêöèè. Âî âñåõ ýòèõ ðàáîòàõ èñïîëüçîâàíà ñòàíäàðòíàÿ ÈÍÑ ñ ïðÿìîé ñâÿçüþ è ñ îáðàòíûì ðàñïðîñòðàíåíèåì îøèáêè.
Åùå îäíèì íàïðàâëåíèåì ÿâëÿåòñÿ èñïîëüçîâàíèå ÈÍÑ
â àíàëèòè÷åñêîé õèìèè äëÿ îïðåäåëåíèÿ õèìè÷åñêîãî ñîñòàâà àíàëèçèðóåìîé ñìåñè, ÷òî êðàéíå âàæíî äëÿ êîíòðîëÿ õèìè÷åñêîãî ïðîèçâîäñòâà è ýêîëîãè÷åñêîãî ìîíèòîðèíãà.  ýòîì ñëó÷àå ðàáîòà ìîæåò ïðîòåêàòü â äâóõ âàðèàíòàõ: äèíàìè÷åñêîì è ñòàòè÷åñêîì.
 ïåðâîì ñëó÷àå èñïîëüçóþò ÈÍÑ, îáó÷åííóþ ïî
çíà÷åíèþ ïîñòóïàþùèõ íà åå âõîä ñèãíàëîâ, ñíÿòûõ ñ äàò÷èêîâ (â êà÷åñòâå òàêèõ ñèãíàëîâ ìîãóò, íàïðèìåð, âûñòóïàòü ïîòåíöèàëû, ñíÿòûå ñ èîí-ñåëåêòèâíûõ ýëåêòðîäîâ
èëè ñ ãàçîâûõ ñåíñîðîâ), âîñïðîèçâîäèòü ïðîöåíòíûé ñîñòàâ àíàëèçèðóåìîé ñìåñè [28, 29].
Âî âòîðîì ñëó÷àå ÈÍÑ ìîæåò áûòü îáó÷åíà, íàïðèìåð, ðàçëàãàòü ñïåêòð ñìåñè íà ñïåêòðû èíäèâèäóàëüíûõ
êîìïîíåíòîâ [30].
Èç ðàáîò ïî ïðèìåíåíèþ ÈÍÑ â ôèçè÷åñêîé õèìèè
íàèáîëåå èíòåðåñíû èññëåäîâàíèÿ, ñâÿçàííûå ñ ìîäåëèðîâàíèåì êèíåòèêè õèìè÷åñêèõ ïðîöåññîâ ñ èñïîëüçîâàíèåì ðåêóððåíòíûõ ñåòåé Õîïôèëäà. Áûëî ïîêàçàíî, ÷òî
ìîäåëèðîâàíèå âîçìîæíî â äâóõ íàïðàâëåíèÿõ. Â îäíîì
ñëó÷àå ïðè ïîìîùè ÈÍÑ ìîæíî ìîäåëèðîâàòü ïðîòåêàíèå õèìè÷åñêèõ ðåàêöèé [31], à â äðóãîì – ñ ïîìîùüþ
ñïåöèàëüíî ïîäîáðàííîãî íàáîðà õèìè÷åñêèõ ðåàêöèé
ìîäåëèðîâàòü äèíàìèêó ðàáîòû ðåêóððåíòíûõ íåéðîííûõ
ñåòåé, ÷òî, â ñóùíîñòè, ýêâèâàëåíòíî ïðîâåäåíèþ âû÷èñëåíèé ïðè ïîìîùè «õèìè÷åñêîãî êîìïüþòåðà» [32]. Áîëüøîé èíòåðåñ âûçûâàåò òàêæå ìîäåëèðîâàíèå ãèïåðïîâåðõíîñòè ïîòåíöèàëüíîé ýíåðãèè ìîëåêóë ïðè ïîìîùè ÈÍÑ
ñ ïðÿìûìè ñâÿçÿìè.  ýòîì ñëó÷àå ïîñëå ïîäà÷è íà âõîä
îáó÷åííîé ÈÍÑ ñèãíàëîâ, îïèñûâàþùèõ ãåîìåòðèþ ìîëåêóëû, íà âûõîäíîì íåéðîíå ôîðìèðóåòñÿ ñèãíàë, ñîîòâåòñòâóþùèé ïîòåíöèàëüíîé ýíåðãèè ìîëåêóëû. Îáó÷åííûå òàêèì îáðàçîì ÈÍÑ ìîãóò áûòü â äàëüíåéøåì èñïîëüçîâàíû äëÿ ìîäåëèðîâàíèÿ äèíàìè÷åñêèõ ñâîéñòâ
ìîëåêóë è ìîëåêóëÿðíûõ ñèñòåì [33–35].
Íàêîíåö, ñëåäóåò îòìåòèòü, ÷òî îäíèì èç íàèáîëåå âàæíûõ íàïðàâëåíèé ïðèìåíåíèÿ ÈÍÑ â îáëàñòÿõ, ñìåæíûõ ñ
õèìèåé, ÿâëÿåòñÿ èõ èñïîëüçîâàíèå â áèîõèìèè è ñòðóêòóðíîé ìîëåêóëÿðíîé áèîëîãèè. Íàèáîëåå âàæíûì ïðèìåíåíèåì ÈÍÑ â ýòîé îáëàñòè ÿâëÿåòñÿ ïðîãíîçèðîâàíèå âòîðè÷íîé ñòðóêòóðû áåëêà ïî åãî ïåðâè÷íîé àìèíîêèñëîòíîé ïîñëåäîâàòåëüíîñòè [36, 37]). Àêòóàëüíîñòü ýòîé çàäà÷è
îïðåäåëÿåòñÿ òåì, ÷òî çíàíèå ïðîñòðàíñòâåííîé ñòðóêòóðû
áåëêà êðàéíå âàæíî äëÿ âîçìîæíîñòè ïðîâîäèòü öåëåíàïðàâëåííîå ñîçäàíèå íîâûõ ëåêàðñòâåííûõ ïðåïàðàòîâ, ìåõàíèçì äåéñòâèÿ êîòîðûõ çàêëþ÷àåòñÿ â ñâÿçûâàíèè ñ ýòèì
326
áåëêîì.  ýòîì ñëó÷àå â êà÷åñòâå âõîäíûõ ñèãíàëîâ ìîæíî èñïîëüçîâàòü ñâîéñòâà àìèíîêèñëîò, íàõîäÿùèõñÿ ðÿäîì ñ òåêóùåé àìèíîêèñëîòîé. Âûõîäíîé ñèãíàë äàåò èíôîðìàöèþ î êëàññèôèêàöèè êîíôîðìàöèè îñíîâíîé
öåïè àìèíîêèñëîòû íà òèïû, ñîîòâåòñòâóþùèå âòîðè÷íîé
ñòðóêòóðå áåëêà (α-ñïèðàëü, β-ñëîé è ò.ä.). Äëÿ ýòîé öåëè,
êàê ïðàâèëî, èñïîëüçóåòñÿ ñòàíäàðòíàÿ ÈÍÑ ñ ïðÿìûìè
ñâÿçÿìè è îáðàòíûì ðàñïðîñòðàíåíèåì îøèáîê ïðè îáó÷åíèè. Åùå áîëüøèé èíòåðåñ ïðåäñòàâëÿþò ðàáîòû ïî
ïðîãíîçèðîâàíèþ òðåòè÷íîé ñòðóêòóðû áåëêà èñõîäÿ èç
åãî ïåðâè÷íîé àìèíîêèñëîòíîé ïîñëåäîâàòåëüíîñòè [38,
39], îäíàêî â ýòîì ñëó÷àå äîñòèãíóòûå óñïåõè íå òàê çíà-
ÂÅÑÒÍ. ÌÎÑÊ. ÓÍ-ÒÀ. ÑÅÐ. 2. ÕÈÌÈß. 1999. Ò. 40. ¹ 5
÷èòåëüíû, êàê ïðè ïðîãíîçèðîâàíèè âòîðè÷íîé ñòðóêòóðû
áåëêà. Äðóãèì íàïðàâëåíèåì ïðèìåíåíèÿ ÈÍÑ â ìîëåêóëÿðíîé áèîëîãèè ÿâëÿåòñÿ àíàëèç ãåíåòè÷åñêîé ïîñëåäîâàòåëüíîñòè è ðàñïîçíàâàíèå âàæíûõ ó÷àñòêîâ ãåíîâ, íàïðèìåð ïðîìîòîðîâ èõ ýêñïðåññèè, ó÷àñòêîâ êîäèðîâàíèÿ áåëêîâ, ó÷àñòêîâ ñâÿçûâàíèÿ ñ áåëêàìè, à òàêæå âûäåëåíèå
ñêðûòûõ ïåðèîäè÷íîñòåé (ìîòèâîâ) [40–43]. ÈÍÑ òàêæå
èñïîëüçóþòñÿ äëÿ ïðîãíîçèðîâàíèÿ ìåñò ñâÿçûâàíèÿ â áåëêàõ ñ íóêëåèíîâûìè êèñëîòàìè, äðóãèìè áåëêàìè èëè ñ
íèçêîìîëåêóëÿðíûìè ëèãàíäàìè [44, 45]. Ðåçóëüòàòû ïîäîáíûõ ïðîãíîçîâ ìîãóò áûòü â äàëüíåéøåì èñïîëüçîâàíû
ïðè ðàçðàáîòêå íîâûõ ýôôåêòèâíûõ ëåêàðñòâåííûõ ñðåäñòâ.
ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ
1. Ãîðáàíü À.Í., Ðîññèåâ Ä.À. Íåéðîííûå ñåòè íà ïåðñîíàëüíîì
êîìïüþòåðå. Íîâîñèáèðñê, 1996.
2. Åæîâ À.À., Øóìñêèé Ñ.À. Íåéðîêîìïüþòèíã è åãî ïðèìåíåíèå
â ýêîíîìèêå è áèçíåñå. Ì., 1998.
3. Zupan J., Gasteiger J. Neural Networks for Chemists - An
Introduction. Weinhem, 1993.
4. Gasteiger J, Zupan J. // Neural Networks in Chemistry, Angew.
Chem. Int. Ed. Engl. 1993. 105. ¹ 4. Ð. 503.
5. Neural Networks in QSAR and Drug Design / Ed. J. Devillers. L.,
1996.
6. Áàñêèí È.È., Ãàëüáåðøòàì Í.Ì., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ.
// Èíôîðìàöèîííûå òåõíîëîãèè. 1997. ¹ 9. C. 27.
7. Áàñêèí È.È., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ. // Íåéðîêîìïüþòåð.
1997. ¹3/4. C. 17.
8. Baskin I.I., Skvortsova M.I., Palyulin V.A., Zefirov N.S. //
Foundations of Computing and Decision Sciences. 1997. 22. ¹ 2.
P. 107.
9. Tetko I.V., Villa A.E.P., Livingstone D.J. // J. Chem. Inf. Comput.
Sci. 1996. 36. ¹ 4. P. 794.
10. Áàñêèí È.È., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ. // ÄÀÍ. 1993. 332.
¹ 6. C. 713.
11. Abilev S.K., Lyubimova I.K., Baskin I.I., Halberstam N.M.
Palyulin V.A. // Karadeniz Journal of Medical Sciences 1995. 8.
¹ 4. P. 227.
12. Baskin I.I., Palyulin V.A., Zefirov N.S. 12th European Symposium
on Quantitative Structure-Activity Relationships «Molecular
Modelling and Prediction of Bioactivity», August 23–28, 1998.
Copenhagen, Denmark, P. 140.
13. Áàñêèí È.È., Ïàëþëèí Â.À., Çåôèðîâ Í.Ñ. // ÄÀÍ. 1993. 333.
¹ 2. C. 176.
14. Baskin I.I., Palyulin V.A., Zefirov N.S. // J. Chem. Inf. Comput.
Sci. 1997. 37. ¹ 4. P. 715.
15. Holzgrabe U., Wagener M., Gasteiger J. // J. Mol. Graphics
1996. 14. ¹ 4. P. 185.
16. Kireev D.B., Ros F., Bernard P., Chretien J.R., Rozhkova N.I.
Computer-Assisted Lead Finding and Optimization. Current
Tools for Medicinal Chemistry. Wiley-VCH, 1997. P. 255.
17. Domine D., Devillers J., Wienke D., Buydens L. // Quant. Struct.Act. Relat. 1996. 15. ¹ 5. P. 395.
18. Domine D., Devillers J., Wienke D., Buydens L. // J. Chem. Inf.
Comput. Sci. 1997. 37. ¹ 1. P. 10.
19. Curry B., Rumelhart D.E. // Tetrahedron Comput. Methodol.
1990. 3. P. 213.
20. Gasteiger J., Li X., Simon V., Novic M., Zupan J. // J. Mol. Struct.
1993. 292. P. 141.
21. Robb E.W., Munk M.E. // Mikrochim. Acta [Wien], 1990.
Ð. 131.
22. Munk M.E., Madison M.S., Robb E.W. // Microchim. Acta [Wien]
1991. II. Ð. 505.
23. Thomsen J.U., Mayer B. // J. Magn. Res. 1989. 84. P. 212.
24. Kvasnicka V. // J. Math. Chem. 1991. 6. P. 63.
25. Áàñêèí È.È., Àéò À.Î., Ãàëüáåðøòàì Í.Ì., Ïàëþëèí Â.À.,
Àëôèìîâ Ì.Â., Çåôèðîâ Í.Ñ. // ÄÀÍ. 1997. 357. ¹ 1. C. 57.
26. Elrod D.W., Maggiora G.M., Trenary R.G. // J. Chem. Inf.
Comput. Sci. 1990. 30. P. 477.
27. Elrod D.W., Maggiora G.M., Trenary R.G. // Tetrahedron
Comput. Methodol. 1990. 3. P. 163.
28. Bos M., Bas A., Van-der-Linden W.E. // Anal. Chim. Acta. 1990.
233. ¹ 1. P. 31.
29. Sundgren H., Winquist F., Lukkarl I., Lundstroem I. // Meas. Sci.
Technol. 1991. 2. P. 464.
30. Wythoff B.J., Levine S.P., Tomellini S.A. // Anal. Chem. 1990. 62.
P. 2702.
31. Lebender D., Schneider F.W. // J. Phys. Chem. 1993. 97. ¹ 34.
P. 8764.
32. Hjelmfelt A. Ross J. // Proc. Natl. Acad. Sci. U.S.A. 1992. 89.
P. 398.
33. Blank T.B., Brown S.D., Calhoun A.W., Doren D.J. // J. Chem.
Phys. 1995. 103. P. 4129.
34. Tafeit E., Estelberger W., Horejsi R., Moeller R., Oettl K., Vrecko
K., Reibnegger G. // J. Mol. Graphics. 1996. 14. P. 12.
35. No K.T., Chang B.H., Kim S.Y., Jhon M.S., Scheraga H.A. /Chem.
Phys. Lett. 1997. 271. P. 152.
36. Qian N., Sejnowski T.J. // J. Mol. Biol. 1988. 202. P. 865.
37. Bohr H., Bohr J., Brunak S., Cotterill R.M.J., Lautrup B.,
Norskov L., Olsen O.H., Petersen S.B. // FEBS Lett. 1988. P. 223.
38. Friedrichs M.S., Wolynes P.G. // Science. 1989. 246. P. 371.
39. Bohr H., Bohr J., Brunak S., Cotterill R.M.J., Fredholm F.,
Lautrup B., Olsen O.H., Petersen S.B. // FEBS Lett. 1990. 261.
P. 43.
40. Brunak S., Engelbrecht J., Knudsen S. // J. Mol. Biol. 1991. 220.
¹ 1. P. 49.
41. Ezhov A.A., Kalambet Yu.A., Cherny D.I. // Stud. Biophys. 1989.
129. P. 183.
42. Åæîâ À.À., Òîêàåâ À.Ã., ×å÷åòêèí Â.Ð. // Íàó÷íàÿ ñåññèÿ
ÌÈÔÈ – 99. Âñåðîññèéñêàÿ íàó÷íî-òåõíè÷åñêàÿ êîíôåðåíöèÿ
«Íåéðîèíôîðìàòèêà-99»: Ñáîðíèê íàó÷íûõ òðóäîâ. ×. 3. Ì.,
1999. Ñ. 182.
43. Ïðîõîðîâ Ð.Â. // Íàó÷íàÿ ñåññèÿ ÌÈÔÈ – 99. Âñåðîññèéñêàÿ
íàó÷íî-òåõíè÷åñêàÿ êîíôåðåíöèÿ «Íåéðîèíôîðìàòèêà-99».
Ñáîðíèê íàó÷íûõ òðóäîâ. ×. 3. Ì., 1999. Ñ. 204.
44. Hirst J.D., Sternberg M.J. // Protein Eng. 1991. 4. ¹ 6. P. 615.
45. Hirst J.D., Sternberg, M.J.E. // Biochemistry. 1992. 31. ¹ 32.
P. 7211.
Ïîñòóïèëà â ðåäàêöèþ 23.04.99
Скачать