I. Co to jest sztuczna inteligencja i do czego się może przydać medykom - 4 godz.
II. Przykłady zastosowań sztucznej inteligencji w medycynie - 4 godz.
Dziedzina nauki, zajmująca się rozwiązywaniem problemów, które nie są efektywnie algorytmizowalne, za pomocą obliczeń.
Pzykłady problemów niealgorytmizowalnych: rozumienie sensu zdań, rozpoznawanie twarzy, rozpoznawanie mowy, pisma ręcznego, planowanie terapii, rozwiązywanie nietypowych problemów.
Efektywna algorytmizowalność: przepis (algorytm) pozwalający na rozwiązanie zadań nie tylko w prostych, ale również złożonych sytuacjach.
Przykład: problem wyboru najkrótszej drogi (problem komwojażera) objazdu 5 miejsc da się łatwo rozwiązać, ale 100 nie, gdyż mamy 100!=10158 możliwości! Tego samego rodzaju są problemy optymalizacji wykorzystania sal wykładowych (układanie planu), upakowania towarów (walizka jeszcze się da dobrze upakować, ale kontener już trudniej).
Częścią CI jest sztuczna inteligencja (Artificial Intelligence, AI), zajmująca się modelowaniem wiedzy, rozwiązywaniem problemów niealgorytmizowalnych w oparciu o symboliczną reprezentację wiedzy.
Dziedziny wchodzące w skład CI: sztuczne sieci neuronowe, logika rozmyta, algorytmy genetyczne i programowanie ewolucyjne, określane często wspólną nazwą "soft computing".
W skład CI wchodzą też:
metody uczenia maszynowego,
rozpoznawania obiektów (pattern recognition),
metody statystyki wielowymiarowej (klasteryzacja, dyskryminacja, metody oparte na podobieństwie),
metody optymalizacji,
metody modelowania niepewności - probabilistyczne, posybilistyczne, zgrzebne (czyli zbiory i logika przybliżona), oraz
metody teorii kontroli i sterowania.
CI wykorzystuje metody matematyczne z wielu dziedzin, korzysta z inspiracji biologicznych, biocybernetycznych, psychologicznych, statystycznych, matematycznych, logicznych, informatycznych, inżynierskich i innych, jeśli mogą się one przydać do rozwiązywania efektywnie niealgorytmizowalnych problemów.
Kilka użytecznych stron zawierających listy odnośników do ciekawych informacji w Internecie:
Wersja silna jest obecnie bardzo intensywnie krytykowana przez filozofów umysłu.
Np. John Searl, "Umysł na nowo odkryty", PIW, Warszawa 1999 - "prawdziwe" zrozumienie nie jest dla maszyn możliwe.
Skuteczność metod AI nie zależy na szczęście od poglądów filozofów - z krytyki nie wynikają jakieś naturalne ograniczenia dla możliwości AI.
1. Gałąź oparta na analizie logicznej, symbolicznej, koncepcyjne rozumienie inteligencji.
2. Gałąź subsymboliczna, modelowanie mózgu, symulacje komputerowe zamiast logicznych analiz.
Dlaczego AI ma szansę działać lepiej niż ludzie?
Irracjonalność ludzkiego myślenia.
Dlaczego jeszcze nie działa zbyt dobrze?
Potrzebne są systemy o podobnym stopniu skomplikowania co ludzkie mózgi, zdolne do aktywnej nauki i gromadzące doświadczenia.
Czym jest wiedza? Jak ją reprezentować?
Filozofia: nauką o naturze wiedzy jest epistemologia.
Rodzaje wiedzy:
Używanie wiedzy:
Teoria reprezentacji wiedzy - słabo rozwinięta.
Logika predykatów
Logika stwierdzeń mających za argumenty obiekty, np. ja, człowiek, kartka.
Predykaty mają argumenty i wartość logiczną, np.
predykat jest-czerwony, większy-od, lżejszy niż
Predykat isa, czyli "jest członkiem".
Logika predykatów dopuszcza kwantyfikatory
Logika pierwszego rzędu: kwantyfikatory do obiektów, a nie predykatów.
Funkcje lub operatory (obiekt): mają argumenty, zwracają inne obiekty
Równość w sensie predykatów: X=Y jeśli "P mamy P(X)=P(Y).
Własności: nie można w niej dowieść fałszywego twierdzenia i wszystkie prawdziwe twierdzenia mają dowód.
Logika pierwszego rzędu i rachunek predykatów pierwszego rzędu są ograniczone
Logiki wyższego rzędu (HOL, Higher-Order Logic) są trudne w implementacji.
Logiki nieklasyczne - później.
Np.
Jeśli kolor-oczu=żółty i bilirubina=wysoka to żółtaczka.
Czy człowiek używa reguł logicznych? Jedynie w nielicznych przypadkach. Próby analizy tekstów w oparciu o reguły logiczne okazały się bardzo trudne, gdyż zbyt wiele takich reguł da się zastosować w konkretnym przypadku i w efekcie nie wiadomo, które zastosować. Jest to powszechny problem, związany z "eksplozją kombinatoryczną", czyli bardzo szybko rosnącą liczbą zagadnień lub reguł, które należy zastosować by rozwiązać pierwotne zadanie. Reprezentacja wiedzy w postaci bardziej złożonych struktur, takich jak "ramy", daje większe możliwości. Ramy zawierają wiedzę ogólną o obiektach, gromadząc wewnątrz opis cech danego obiektu. Nieznane cechy mogą mieć wartości domyślne, najczęściej spotykane, mogą mieć też procedury związane z używaniem wiedzy zawartej w ramach.
Systemy produkcyjne składają się z 3 części:
a) bazy reguł produkcji
b) specjalnej struktury danych, nazywanej kontekstem
c) interpretera, kontrolującego aktywność systemu
Zalety systemów produkcyjnych:
Ogólna rama, PIES |
Klasa: Zwierzę; zwierzę domowe |
Rama: PIES SĄSIADA |
Klasa: Pies |
Jednakże używanie ram nie rozwiązuje podstawowego problemu, jakim jest dobór odpowiedniej wiedzy kontekstowej do danej sytuacji, a więc wybór ram, które należy użyć. Reprezentacja wiedzy w postaci reguł lub ram działa bardzo dobrze jeśli mamy do czynienia z niewielką, ściśle zdefiniowaną domeną wiedzy, dla której znanych jest niewiele faktów.
Którą ramę zastosować do danej sytuacji?
Problem "kruchości" reprezentacji.
Dobór strategii przez dobór ram.
Głębokie rozumowanie wymaga algorytmów szukania.
Szukanie - jedna z najważniejszych metod informatyki
Przestrzeń poszukiwań:
Rozumowanie bezpośrednie; data driven; z dołu do góry, bottom-up
Rozumowanie wsteczne: goal directed, z góry na dół, top-down
Analiza środków i celów (means-ends analysis)
Reprezentacja wiedzy:
Grafy lub struktury drzewiaste - strategie przeszukiwania
Zagadnienia nieobliczalne, NP-trudne - liczba węzłów rośnie kombinatorycznie, prowadząc do "eksplozji kombinatorycznej".
Wiedza heurystyczna - pomocna, wynikająca z doświadczenia, ale nie gwarantująca rozwiązania.
2 | 1 | 7 | |
Reprezentacja problemu w przestrzeni stanów, np. w problemie 8-ki: | 3 | 8 | |
5 | 4 | 6 |
Jak przewieźć lisa, gęś i ziarno małą łódką na drugą stronę rzeki, jeśli zmieści się w niej nie więcej niż jedna rzecz ?
Odpowiednia reprezentacja to znaczna część rozwiązania problemu: uwidacznia istotne relacje, pozwala na ujawnienie się wszystkich więzów ograniczających możliwe relacje, powinna być zrozumiała, kompletna, zwięzła i pozwalająca na efektywne wykorzystanie w modelu komputerowym.
Przykład: Czy 31 domin może pokryć wszystkie pola szachownicy, z której usunięto 2 rogi?
Jeśli mamy jakieś funkcje oceny "dobrej sytuacji", odległości od pożądanego rozwiązania, kosztów, obecnego stanu, np. w 15-ce odległość poszczególnych cyfr od ich końcowego położenia, możemy używać algorytmów szukania heurystycznego.
Wspinanie do góry (hill climbing), na każdym kroku najlepsze rozwiązanie; metody gradientowe nie gwarantują najlepszych wyników.
Najpierw najlepszy, lub na każdym kroku kilka najlepszych.
A* - wariant metody "najpierw najlepszy" używający kosztów dojścia do danego etapu i oceny kosztów dojścia do stanu końcowego.
Szukanie niedeterministyczne: Monte Carlo, przypadkowo generuj nowe konfiguracje.
Simulated annealing, czyli metoda stopniowego studzenia: przypadkowo generuj i powoli skupiaj się na najbardziej interesujących, stosując coraz mniejsze odstępstwa od najlepszych.
Algorytmy genetyczne: wybierz nowe konfiguracje stosując operatory mutacji i krzyżowania.
Procedura minimaxu: jeśli nie wystarczy ocena statyczna, np. w grach z przeciwnikiem, zakłada się najlepsze ruchy przeciwnika.
Zasada alfa-beta: parametry oceniające, którymi posunięciami warto się zajmować
Analiza celów i środków (means-ends analysis) - mierz siły na zamiary
Ekspert pamięta 50-100 tysięcy "prototypowych" wzorców lub struktur.
Ogromna pamięć, rozpoznawania wzorców.
Liczba pamiętanych "prototypowych" wzorców rzędu 50.000 - 100.000
Pomiedzy szybkością szukania, liczbą reguł i poziomem kompetencji istnieje wyraźny związek.
Komputery i mózgi mają całkiem inne ograniczenia sprzętowe.
Mistrz ułoży po 5-sekundowej ekspozycji średnio 23 figury z 25 na pokazanych pozycjach a nowicjusz tylko 3 lub 4 figury.
Jeśli jednak figury ułożone są przypadkowo to robi taką samą liczbę błędów.
Mechanizm "porcjowania" (chunking) przy pamiętaniu złożonych struktur.
Monty Hall Paradox, czyli przykład złudzenia kognitywnego. Mamy 3 kubki. Wychodzisz z pokoju, ja pod jednym z kubków ukrywam złotą monetę. Wracasz i wybierasz jeden z kubków. Ja - wiedząc, pod którym jest moneta - odkrywam jeden z pustych kubków. Masz teraz szansę zmienić swoją decyzję i pozostać przy już wybranym kubku lub wybrać pozostały.
Czy najlepszą strategią jest:
Co jeśli dwie osoby wybierają?
Metody AI pozwalają odszukać dokumenty na podstawie sensu pytania, a nie tylko słów kluczowych. Wymaga to zdefiniowania przestrzeni koncepcji dla danego pytania.
Spośród innych programów wykorzystujących techniki AI systemy eksperckie wyróżnia używanie obszernej wiedzy w postaci faktów i procedur (sposobów postępowania) zdobytych od prawdziwego eksperta.
Jest to inteligentny program komputerowy wykorzystujący procedury wnioskowania do rozwiązywania tych problemów, które są na tyle trudne, że normalnie wymagają znaczącej ekspertyzy specjalistów. Wiedza (niezbędna, by zapewnić odpowiedni poziom ekspertyzy), wraz z procedurami wnioskowania, może być uważana za model ekspertyzy, normalnie posiadanej tylko przez najlepszych specjalistów w tej dziedzinie. Wiedza systemu eksperckiego składa się zazwyczaj z faktów i heurystyk. Fakty są podstawą bazy wiedzy systemu - informacją, która jest ogólnie dostępna i powszechnie akceptowana przez specjalistów w danej dziedzinie. Heurystyki są zwykle bardziej subiektywną informacją, która charakteryzuje proces oceny i rozwiązywania problemu przez określonego specjalistę. Przykładami heurystyk są: intuicyjne domysły, przypuszczenia, zdroworozsądkowe zasady postępowania. Poziom ekspertyzy, oferowany przez dany system ekspercki, jest przede wszystkim funkcją rozmiaru i jakości bazy wiedzy danego systemu.
SE: systemy oparte na wszystkich sposobach reprezentacji wiedzy, najczęściej w postaci reguł produkcji.
Bazy wiedzy oddzielone są od mechanizmów wnioskowania.
Reguły produkcji:
<obiekt,atrybut,wartość>, np. <samochód,kolor,czerwony>
Architektury:
hierarchiczna: dzieli wiedzę na dziedziny, zawiera meta-poziom
wielowarstwowa: kilka poziomów, np. działanie, planowanie, strategia
tablicowa (blackboard): łączenie wiedzy z kilku źródeł
hybrydowa: regułowo-koneksjonistyczna
symulacyjna: modele numeryczne i sieci powiązań przyczynowych
korzystająca z analogii: case-based reasoning
DSS (Decision Support Systems), Systemy Wspomagania Decyzji
Dialog z użytkownikiem i wyjaśnienia sposobów wnioskowania systemu.
Nie zawsze system rozumuje w sposób podobny do człowieka.
Rozumowanie retrospektywne
Rozumowanie hipotetyczne: co by było gdyby ...
Rozumowanie kontrfaktyczne, wbrew faktom (counterfactual reasoning): byłoby lepiej gdyby P było faktem; czemu nie ma P? Czasami odwrotnie, jest gorzej bo P, czemu jest?
Prawdopodobieństwo warunkowe, współczynniki ufności lub pewności (confidence factors), teoria wiarygodności, teoria zbiorów rozmytych.
Program do diagnostyki i terapii chorób zakaźnych (Stanford, 1972).
Wiedza: reguły produkcji, listy, tabele, opis parametrów klinicznych
THEN Istnieją silne poszlaki, że jest to klasa Enterobacteriacae.
THEN z poziomem ufności 0.4 reguły dotyczące Enterobacteriacae powinny być użyte przed regułami dotyczącymi pałeczek.
Porównanie diagnoz i zaleceń MYCIN z zaleceniami 5 specjalistów z kliniki w Stanfordzie: MYCIN 52 punkty, specjaliści od 34 - 50 punktów, student medycyny uzyskał 24 punkty.
EMYCIN (1981), NEOMYCIN (1984)
PUFF i jego rozwinięcie CENTAUR (1983), diagnoza chorób płuc.
INTERNIST: choroby poszczególnych organów: płuc, serca, wątroby
Wiele innych systemów medycznych.
Przykład systemu eksperckiego: program AI-TEX.
Czemu nie ma SE w szpitalach?
Trochę jest: Przykłady zastosowań systemów eksperckich w medycynie.