AI – rozpoznawanie mowy i obrazu to za mało!

Postęp technologiczny otwiera nam nowe możliwości rozwiązań, o których kilka lat temu nam się nie śniło. To tak jak wejść do korytarza, a w nim otwierają się kolejne drzwi ku naszym marzeniom. Jeśli nie będziemy się uczyć, nie zobaczymy nowych możliwości.

Gdy tworzyłem koncepcję Globalnej Dynamicznej Mapy Myśli i Algorytmów  (GDMMiA) miałem kilka problemów strategicznych, jak można przekształcić zmysły, myśli człowieka, wiedzę zapisaną w książkach, nośnikach cyfrowych, obrazach, filmach  na algorytmy. Sztuczna inteligencja (AI) potrzebuje algorytmów, do konstrukcji nowych rozwiązań technologicznych w oparciu o listy “to do”. Algorytm powstaje z myśli człowieka. Człowiek zaś ma kreatywne myślenie, ale oparte na swoim doświadczeniu i wiedzy, czyli danych napływających z otaczającego nas świata. Niezależnie od naszego myślenia maszyny komputerowe będą mogły tworzyć własne algorytmy, pod warunkiem dostarczenia im dużej ilości danych (big data). Przyzwyczailiśmy się do danych zapisanych w arkuszach kalkulacyjnych i treści pisanej. Jednak najbardziej “dano-chłonne” są obrazy, filmy, dźwięki. Tu jest skarbnica danych.

Jeżeli maszyny są w stanie wychwytywać komendy wydawane głosem podczas rozpoznawania mowy (jeden z pierwszych zajmujący się tym tematem to Kai-Fu Lee) oraz rozpoznawania prostych, statycznych obrazów (zajmuje się tym m. in. Google – Kuba Piwowar z Google – 2018 r ), to może z czasem będą w stanie same w stanie tworzyć algorytmy z danych dostarczanych im w formie audio (np. podcast), obrazów czy filmów.

źródło – wyszukiwarka Bing(Is nationalism a logical reaction to globalization? – netivist)

Wyobraźmy sobie, że filmujemy wykonywanie jakiejś czynności. Następnie komputer analizuje audio z obrazem i tworzy algorytm czynności znajdujących się na filmie. Może wychwyci więcej niż człowiek? Stworzy niekonwencjonalne rozwiązania, będzie świetnym narzędziem dydaktycznym, czy projektowym.

Dlatego traktuję obecne bania nad rozpoznawaniem mowy i dźwięku jako pionierskie abecadło sztucznej inteligencji (przedszkole AI). Czas na szkołę i studia :). Patrzmy za horyzont! (Look beyond the horizon).

(Voyagers | arise to see beyond the horizon of your dreams …)

Co z innymi zmysłami – dotykiem, smakiem, zapachem? To też może być algorytmem.

Wyobraźmy sobie cały przemysł kosmetyczny, kulinarny, medycynę wsparte o takie urządzenia.

Co lekarz ma wspólnego ze sztuczną inteligencją? Niedługo już nic, jak go zastąpi w ciągu najbliższych 15 lat 🙁

Trzeba znaleźć miejsce w medycynie dla AI i dla lekarza. Na początku będę współpracować, potem czynnik ludzki zejdzie na drugi plan.

Dlatego interesuje się w chwili obecnej uczeniem maszynowym, uczeniem głębokim i sieciami neuronowymi.. Podziwiam pasjonatów algorytmów, takich Vladimir Alekseichenko (oryginał nazwiska to chyba Владимир Алексейченко – czyli polska i rosyjska wymowa Władimir Aleksiejczenko) (podcaster i programista uczenia maszynowego oraz NLP – przetwarzanie języka naturalnego), ale liczę także na ich zainteresowanie w rozwijaniu sztucznej inteligencji (polecam polską stronę Sztuczna inteligencja) na bazie GDMMiA.

It is not a pipe dream!   🙂

JAGERS TRAUM hunter sits smoking pipe & dreaming of stag …

 

.