Innowacyjne rozwiązania informatyczne wykorzystywane w Life Science
Life science to nauka poświęcona jednemu z najważniejszych jeśli nie najważniejszemu obszarowi - ludzkiemu życiu. Zespoły naukowe na całym świecie nieustannie pracują nad stworzeniem innowacyjnych produktów mających na celu poprawić jakość naszego życia i zdrowia. Rosnące wymagania, walka z czasem, jak również coraz większa precyzja i efektywność uzyskiwanych algorytmów sprawia, iż rozwiązania IT coraz częściej wykorzystywane są w medycynie, farmacji i naukach biologicznych.
W klasycznej diagnostyce mikrobiologicznej identyfikacja mikroorganizmu chorobotwórczego, z wykorzystaniem metody hodowli, składa się z wielu etapów i może trwać od kilku dni do kilku tygodni. Pobrany od pacjenta materiał biologiczny namnaża się na podłożach sztucznych a następnie izoluje się patogenne mikroorganizmy w celu ich identyfikacji gatunkowej oraz zbadania lekooporności. W diagnostyce wykorzystuje się między innymi podłoża wybiórczo-różnicujące, testy biochemiczne, i/lub serologiczne. Z materiałów klinicznych często izoluje się nie tylko jednego gatunek, ale mieszaninę kilku gatunków mikroorganizmów, co dodatkowo wydłuża czas identyfikacji i wydania lekarzowi wyniku badania.
Konkurencyjnym dla standardowych metod rozwiązaniem jest proponowana przez zespół informatyków pod kierunkiem dr Bartosza Zielińskiego oraz zespół mikrobiologów prowadzony przez prof. dr hab. Monikę Brzychczy-Włoch metoda, która polega na zastosowaniu głębokiego uczenia maszynowego (ang. multi-MIL, deep multiple instances learning) do klasyfikacji i identyfikacji pojedynczych bakterii z mieszanin różnych gatunków bakterii ze zdjęć mikroskopowych. Opracowana metoda ma skuteczność powyżej 90%. Zastosowanie metody głębokiego uczenia w diagnostyce mikrobiologicznej nie tylko znacznie ogranicza koszty i nakład pracy mikrobiologa, ale przede wszystkim istotnie skraca czas identyfikacji drobnoustrojów, nawet o 1-4 dni, przyspieszając tym samym wdrożenie skutecznej terapii przeciwdrobnoustrojowej.
Biorąc pod uwagę narastający deficyt specjalistów w służbie zdrowia automatyzacja czynności diagnostycznych z punktu widzenia pacjenta może przyczynić się znacząco do szybszej diagnostyki a tym samym do wprowadzenia odpowiedniego leczenia. Zaproponowany przez naukowców z UJ i UJ CM wynalazek bardzo dobrze wpisuje się w obecne trendy zaawansowanej diagnostyki mikrobiologicznej.
Analizy danych i wizualizacji wyników - Program GenExpA
Ilościowa reakcja łańcuchowa polimerazy w czasie rzeczywistym (ang. real time quantitative polymerase chain reaction, qPCR) to metoda analityczna szeroko stosowana zarówno w badaniach naukowych jak i diagnostyce. W metodzie tej poziom ekspresji badanych genów normalizowany jest względem genu/genów referencyjnych. Aby gen referencyjny był prawidłowym wzorcem, poziom jego ekspresji powinien być stały niezależnie od czynników środowiskowych jakim podlega komórka lub jej stanu fizjologicznego.
Istotnym etapem metody jest właściwy wybór genów referencyjnych. Ich arbitralny dobór np. jedynie na podstawie literatury, skutkuje błędnym wyznaczeniem poziomu ekspresji genów badanych, a co za tym idzie błędną interpretacją wyników. Z kolei stosowanie jedynie ogólnie dostępnych programów komputerowych do wyboru referencji, np. geNorm, NormFinder czy BestKeeper prowadzi do uzyskania różnych wyników, co związane jest z ograniczeniami jakie te algorytmy ze sobą niosą.
Próbując rozwiązać ten problem zespół naukowy z Wydziału Biologii Uniwersytetu Jagiellońskiego w składzie dr hab. Dorota Hoja-Łukowicz, prof. UJ oraz dr Marcelina Janik, opracował program komputerowy o nazwie GenExpA do analizy danych i wizualizacji wyników z metody RT-qPCR oparty o nowatorską metodę uzyskiwania ulepszonej referencji.
Rozwiązanie łączy w sobie funkcjonalności programów wyznaczających najlepsze geny referencyjne oraz programów typu arkuszy kalkulacyjnych, pozwalających na analizę poziomu ekspresji genu badanego, analizę statystyczną otrzymanych wyników i ich interpretację graficzną. Istotnym elementem rozwiązania jest zaimplementowanie określonego schematu analizy danych RT-qPCR (usuwanie genów o najsłabszej stabilności z następującą po tym ponowną analizą danych surowych) oraz wprowadzenie wartości współczynnika spójności określającego rzetelność/wiarygodność przeprowadzonej analizy. Usprawnieniem całości procesu jest także automatyczne generowanie wykresów pudełkowych prezentujących otrzymane wyniki analizy, włącznie z zaznaczonymi na wykresie istotnościami statystycznymi pomiędzy badanymi elementami danego modelu. Program umożliwia jednoczesną, niezależną analizę wielu genów badanych.
Opracowane narzędzie informatyczne umożliwia:
1) selekcję referencji, o ulepszonej wartości stabilności, z wyjściowej puli potencjalnych genów referencyjnych;
2) określenie rzeczywistego poziomu ekspresji genów badanych;
3) prawidłową interpretację biologiczną wyników na podstawie kompleksowej analizy danych surowych otrzymanych w reakcji RT-qPCR dla wieloelementowych modeli eksperymentalnych (duże grupy badawcze złożone z linii komórkowych, próbek pobranych od pacjentów lub zwierząt).
Program testowy można znaleźć tutaj.
Autorzy: Klaudia Polakowska, Katarzyna Małek-Ziętek, Renata Bartoszewicz
Automatyzacja testów diagnostycznych
Najnowsze analizy i raporty rynkowe pokazują coraz bardziej istotną rolę sztucznej inteligencji w obszarze diagnostyki medycznej. Tworzenie nowych algorytmów wspierających decyzyjność lekarzy, poprawa jakości badania i redukcja czasu poświęcanego na te zadania są kluczowe pod kątem rzetelnej diagnostyki, klasyfikacji chorób oraz profilaktyki medycznej. Według danych WHO w 2019 r. brakowało około 4,3 miliona pielęgniarek, lekarzy i innych pracowników służby zdrowia na całym świecie. Przeciążony system opieki medycznej zmagający się z czasochłonnymi metodami diagnostycznymi napędza zapotrzebowanie na zautomatyzowane, innowacyjne i szybsze testy diagnostyczne.W klasycznej diagnostyce mikrobiologicznej identyfikacja mikroorganizmu chorobotwórczego, z wykorzystaniem metody hodowli, składa się z wielu etapów i może trwać od kilku dni do kilku tygodni. Pobrany od pacjenta materiał biologiczny namnaża się na podłożach sztucznych a następnie izoluje się patogenne mikroorganizmy w celu ich identyfikacji gatunkowej oraz zbadania lekooporności. W diagnostyce wykorzystuje się między innymi podłoża wybiórczo-różnicujące, testy biochemiczne, i/lub serologiczne. Z materiałów klinicznych często izoluje się nie tylko jednego gatunek, ale mieszaninę kilku gatunków mikroorganizmów, co dodatkowo wydłuża czas identyfikacji i wydania lekarzowi wyniku badania.
Konkurencyjnym dla standardowych metod rozwiązaniem jest proponowana przez zespół informatyków pod kierunkiem dr Bartosza Zielińskiego oraz zespół mikrobiologów prowadzony przez prof. dr hab. Monikę Brzychczy-Włoch metoda, która polega na zastosowaniu głębokiego uczenia maszynowego (ang. multi-MIL, deep multiple instances learning) do klasyfikacji i identyfikacji pojedynczych bakterii z mieszanin różnych gatunków bakterii ze zdjęć mikroskopowych. Opracowana metoda ma skuteczność powyżej 90%. Zastosowanie metody głębokiego uczenia w diagnostyce mikrobiologicznej nie tylko znacznie ogranicza koszty i nakład pracy mikrobiologa, ale przede wszystkim istotnie skraca czas identyfikacji drobnoustrojów, nawet o 1-4 dni, przyspieszając tym samym wdrożenie skutecznej terapii przeciwdrobnoustrojowej.
Biorąc pod uwagę narastający deficyt specjalistów w służbie zdrowia automatyzacja czynności diagnostycznych z punktu widzenia pacjenta może przyczynić się znacząco do szybszej diagnostyki a tym samym do wprowadzenia odpowiedniego leczenia. Zaproponowany przez naukowców z UJ i UJ CM wynalazek bardzo dobrze wpisuje się w obecne trendy zaawansowanej diagnostyki mikrobiologicznej.
Analizy danych i wizualizacji wyników - Program GenExpA
Ilościowa reakcja łańcuchowa polimerazy w czasie rzeczywistym (ang. real time quantitative polymerase chain reaction, qPCR) to metoda analityczna szeroko stosowana zarówno w badaniach naukowych jak i diagnostyce. W metodzie tej poziom ekspresji badanych genów normalizowany jest względem genu/genów referencyjnych. Aby gen referencyjny był prawidłowym wzorcem, poziom jego ekspresji powinien być stały niezależnie od czynników środowiskowych jakim podlega komórka lub jej stanu fizjologicznego. Istotnym etapem metody jest właściwy wybór genów referencyjnych. Ich arbitralny dobór np. jedynie na podstawie literatury, skutkuje błędnym wyznaczeniem poziomu ekspresji genów badanych, a co za tym idzie błędną interpretacją wyników. Z kolei stosowanie jedynie ogólnie dostępnych programów komputerowych do wyboru referencji, np. geNorm, NormFinder czy BestKeeper prowadzi do uzyskania różnych wyników, co związane jest z ograniczeniami jakie te algorytmy ze sobą niosą.
Próbując rozwiązać ten problem zespół naukowy z Wydziału Biologii Uniwersytetu Jagiellońskiego w składzie dr hab. Dorota Hoja-Łukowicz, prof. UJ oraz dr Marcelina Janik, opracował program komputerowy o nazwie GenExpA do analizy danych i wizualizacji wyników z metody RT-qPCR oparty o nowatorską metodę uzyskiwania ulepszonej referencji.
Rozwiązanie łączy w sobie funkcjonalności programów wyznaczających najlepsze geny referencyjne oraz programów typu arkuszy kalkulacyjnych, pozwalających na analizę poziomu ekspresji genu badanego, analizę statystyczną otrzymanych wyników i ich interpretację graficzną. Istotnym elementem rozwiązania jest zaimplementowanie określonego schematu analizy danych RT-qPCR (usuwanie genów o najsłabszej stabilności z następującą po tym ponowną analizą danych surowych) oraz wprowadzenie wartości współczynnika spójności określającego rzetelność/wiarygodność przeprowadzonej analizy. Usprawnieniem całości procesu jest także automatyczne generowanie wykresów pudełkowych prezentujących otrzymane wyniki analizy, włącznie z zaznaczonymi na wykresie istotnościami statystycznymi pomiędzy badanymi elementami danego modelu. Program umożliwia jednoczesną, niezależną analizę wielu genów badanych.
Opracowane narzędzie informatyczne umożliwia:
1) selekcję referencji, o ulepszonej wartości stabilności, z wyjściowej puli potencjalnych genów referencyjnych;
2) określenie rzeczywistego poziomu ekspresji genów badanych;
3) prawidłową interpretację biologiczną wyników na podstawie kompleksowej analizy danych surowych otrzymanych w reakcji RT-qPCR dla wieloelementowych modeli eksperymentalnych (duże grupy badawcze złożone z linii komórkowych, próbek pobranych od pacjentów lub zwierząt).
Program testowy można znaleźć tutaj.
Autorzy: Klaudia Polakowska, Katarzyna Małek-Ziętek, Renata Bartoszewicz