Witam,
 
Dostalem dane od pana Yuty z FQS, ktore sa generowane z programu ADAPT, o ktorym rozmawialismy jakis czas temu. Moglyby one posluzyc do przeprowadzenia testow na GM. Dane te sa uzywane do problemu bioprzyswajalnosci lekarstw zazywanych ustnie (Drug Human Oral Bioavailability). Dokladny opis tych danych mozna znalezc w artykule:
Yoshida, Topliss "QSAR Model for Drug Human Oral Bioavailability" J. Med. Chem. 2000,43,2575.
Ponizej krotki opis danych:
1. Calkowita liczba parametrow (cech) ID(max)=321
2. Lista danych
- pierwsza kolumna: numer ID(cechy), kod programu, subID - liczba generowanych cech, typ danych (1=real, 0=integer), liczba probek(rekordow)
- druga kolumna oraz wszystkie pozostale zawieraja dane ulozone zgodnie z nastepujacym porzadkiem:
1,2,3,4,5,6,
7,8,9,10,11,12
itd
 
Tak wiec dane na potrzeby GhostMinera nalezalo by przerobic w taki sposob zeby skladaly sie z 321 kolumn(cech) oraz 265 wierszy(rekordow) i wyrzucic niepotrzebne liczby z pierwszej kolumny.
 
Analiza:
wszystkie rekordy (265) sa sklasyfikowane na dwie klasy:
klasa I: od 1 do 105 rekordu (105 zwiazkow)
klasa II: od 106-265 rekordu
Calkowita liczba istotnych deskryptorow: 25 (dokonana metoda wyboru cech)
Lista tych deskryptorow jest nastepujaca:
20,26,41,42,45,58,59,67,68,77,80,82,83,136,152,153,160,169,170,176,201,220,267,274,292
 
Metoda obliczeniowa uzyta w tej klasyfikacji bylo cos co nazywaja "linear machine learning"
Uzyskane przez nich wyniki sa nastepujace:
Klasa I: poprawnie sklasyfikowanych 87 wartosci, zle sklasyfikowanych 18 wartosci (dokladnosc 82.9%)
Klasa II: poprawnie sklasyfikowanych 148 zwiazkow, zle sklasyfikowanych 12 (dokladnosc 92.5%)
Calkowita dokladnosc klasyfikacji wynosi 88.7%.
Mysle ze byloby interesujace (o ile to mozliwe) przeprowadzenie podobnej analizy w oparciu o metody ktore sa zawarte w GM. Widac z powyzszego ze istotna funkcja jest wstepny wybor cech i nalezaloby sie skupic na tym w nastepnych wersjacj GM.
W razie dodatkowych pytan odnosnie danych przesle je dalej do pana Yuty.
Pozdrawiam,
 
M.P.
 
 
*************************************************
Marek Pajda, PhD
Project Leader
Research & Development Group
FQS Poland Ltd a Fujitsu company
31-038 Krakow
Starowislna 13-15
Poland
tel. +48 12 429 43 45
fax +48 12 429 61 24