Vidovite neuronske mreže
Bioinformatika na putu uklanjanja verovatnoće
Prirodna ljudska radoznalost je omogućila da se sve dostupne činjenice o našem okruženju razvrstaju u zasebne naučne kategorije. Međutim, što dublje zalazimo u revolucionarna otkrića koja nas vode ka neočekivanoj egzaktnosti savremenih istraživanja, to se naučnici iz različitih sfera udružuju da pronađu jedinstveno rešenje za probleme koje nam nameće današnjica.
Statistika, kao grana matematike koja se bavi sakupljanjem, analizom i interpretacijom podataka je neizostavan deo bioloških istraživanja međusobno ih objedinjujući u konzistentnu celinu. Naglim procvatom računarskih nauka u dvadeset prvom veku biostatistika je dobila vanserijsko unapređenje u vidu algoritama za mašinsko učenje.
Alati za mašinsko učenje
Izvor: https://internetzanatlija.com/2020/10/25/dobri-alati-za-masinsko-ucenje-vodic-za-pocetnike/
Mašinsko učenje
Ovaj tip učenja se zasniva na koncepciji generičkih algoritama koji na osnovu zadatih informacija mogu izdvojiti određene podatke i dati zaključke bez unapred ispisanog koda za postojeći problem. Ovaj koncept poseduje više varijacija, a najznačajnije među njima podrazumevaju nadgledano i nenadgledano učenje.
Nadgledano mašinsko učenje podrazumeva „treniranje“ računara unosom značajne količine ulaznih i izlaznih parametara, nakon čega program pomoću algoritma stiče sposobnost povezivanja početnih i krajnjih podataka. Nakon akumulacije stečenih obrazaca, računar je prilikom novog unosa sposoban da samostalno generiše konačni rezultat.
Sistem funkcioniše po principu klasifikacije i regresije. U sistem je potrebno uneti dovoljnu količinu „pozitivnih“ i „negativnih“ rezultata kako bi sve teklo po planu. Primera radi, ovom metodom je moguće „istrenirati“ mašinu da odredi verovatnoću interakcije između određenih vrsta proteina u odnosu na njihovu strukturu, ali je neophodno uvrstiti proteinske sekvence za koje je preko određenih eksperimentalnih metoda kao što NMR i XRD dokazana ili opovrgnuta sklonost ka formiranju veza.
Nenadgledano mašinsko učenje predstavlja unos parametara bez prethodno naznačenih ciljnih tačaka. Celokupna njegova uloga je detekcija obrazaca u neobrađenoj skupini informacija. Neki od sistema funkcionalnosti ovog vida učenja su grupisanje unesenih parametara u klastere (grupe), njihovo hijerarhijsko raspoređivanje, kao i primena Gausovog modela mešavine.
Veštačka inteligencija i mašinsko učenje
Izvor: https://www.mmscode.com/2019/04/23/vjestacka-inteligencija-i-masinsko-ucenje
Načini primene mašinskog učenja u oblasti biologije
Kao što je i ranije u tekstu naznačeno, mašinsko učenje doprinosi saznanjima o strukturi biomolekula i verovatnoći njhove interakcije. Shodno tome, po identičnim principima funkcionišu programi koji prolazeći kroz baze podataka koje uključuju istraživanja i naučne radove, mogu da naprave procenu o broju poklapanja određenih naziva lekova i njihovih efikasnosti u poređenju jednih sa drugima.
Genomika je kao nauka značajno uvećala svoj kapacitet s pojavom alatki koje poseduju veštinu otkrivanja kodirajućih sekvenci u genomu gotovo za treptaj oka. Predikcije izvedene od strane algoritma imaju daleko veću preciznost u odnosu na tipične klasične metode pretrage zasnovane na proučavanju homologih nizova.
Dubinsko učenje
Neizostavno, ljudski organizam je još jednom poslužio kao inspiracija za revolucionarni vid obrade podataka zasnovanog na principima neuronskih mreža. „Dubinsko učenje“ podseća na protok informacija kroz višeslojni splet neurona u mozgu. Upravo su slojevi algoritama ključni za smanjenje mogućnosti od nastajanja greške. Neprekidnom komunikacijom između istih dolazi do efikasne filtracije podataka. Ovaj pristup je doveo do unapređenja računarsku biologiju stvarajući uslove za otkrića u okviru istraživanja u okviru farmaceutske industrije, borbe protiv malignih oboljenja i prevencije genetski prouzrokovanih bolesti.
Jedan od najboljih primera praktične primene „dubinskog učenja” u vidu mimikrije neuronskih mreža je predikcija podložnosti malignitetima. Grupa naučnika (Naushead et al.) je još 2016. godine razvila model koji analizira međusobnu interakciju gena, demografskih indikatora i načina ishrane ispitanika kako bi predvideli verovatnoću nastanka karcinoma dojke kod pojedinaca. Model je identifikovao varijable koje neosporno utiču na rizik uključujući izloženost estrogenu i nedostatak folata u ishrani. Istraživanje se pokazalo kao veoma precizno sa 94,2% tačnosti!
S obzirom na značajna ulaganja u IT industriju i dosadašnju saradnju timova stručnjaka sa idejom o izradi sveobuhvatniih projekata, možemo sa sigurnošću reći da je primena mašinskog učenja u biološkim naukama samo početak turbulentnog putovanja koje će doneti zaključke vredne promene percepcije pojedinih segmenata sveta koji nas okružuje.
Računarska neuronska mreža
Izvor: https://miro.medium.com/max/875/1*eJ36Jpf-DE9q5nKk67xT0Q.jpeg
Izvori:
- https://www.ibm.com/cloud/learn/unsupervised-learning#toc-common-uns-_knyXRTd
- https://www.ibm.com/cloud/learn/supervised-learning
- https://static1.squarespace.com/static/5443d7c7e4b06e8b47de9a55/t/5a240960c8302530429f629e/1512311141147/JYI_Dec2017_122to124*.pdf
- https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1689-0
- https://www.arm.com/glossary/machine-learning-algorithms?utm_term=&gclid=Cj0KCQjw_fiLBhDOARIsAF4khR3xjnbunBxG0F1JmoljR4NMHxlvGuEUlQZ4YeebUXngpaVn1Pt8WS8aAhPnEALw_w