czwartek, 25 października 2012

Statystyka like a boss

W poprzedniej notce zahaczyliśmy lekko (nawet bardzo lekko) o statystykę. Statystyka jest jedynym sposobem, aby przekształcić nasze pipetowania, wirowania czy inkubacje w spójny wynik, który możemy przedstawić szerszej publiczności. Dodatkowo, rozmaite testy statystyczne pozwalają nam ustalić, czy nasze odkrycie jest w jakikolwiek sposób istotne.
Podstawowym narzędziem, jakiego używamy, jest język programowania R - open source'owa alternatywa dla STATISTIKI. Pierwsza wersja tego języka powstała w 2000 roku jako implementacja języka S, o którym nikt normalny nie słyszał, gdyż został on opracowany w roku 1976, czyli w czasach, kiedy komputery wyglądały w najlepszym wypadku tak:
(źródło - en.wikipedia.org)

W każdym razie, R ma wszystko, czego statystyczny statystyk (pun not intended) potrzebuje do szczęścia - bogaty wybór testów statystycznych, możliwość tworzenia filtrów, pętli oraz całkiem dobrze prezentujących się wykresów (swego czasu wzruszyłem się podczas konferencji naukowej Dzień Mózgu, widząc na czyjejś prezentacji stworzone za pomocą R wykresy). Poza tym, jako oprogramowanie typu open source, R jest całkowicie darmowy - wystarczy ściągnąć (tym bardziej, że już jutro premiera wersji 2.15.2).


Programowanie w R jest dosyć łatwe (jak na programowanie oczywiście) - wszelkie nasze pomyłki skutkują wyrzuceniem błędu lub ostrzeżenia, często ze wskazaniem części kodu odpowiedzialnej za błąd (aczkolwiek są wyjątki: wczoraj spędziłem pół wieczora, zastanawiając się z koleżanką, dlaczego w jej wykresie nie znika opis osi x - okazało się, że zamiast "xaxt='n'" napisała "xant='n'", o czym program nie poinformował, tylko po prostu zignorował ten parametr i wyświetlił wykres z opisem osi x). Pomoc do każdej funkcji możemy uzyskać, wpisując w konsolę ?nazwa_funkcji.

Zaczątki pętlowej Incepcji - pętla if wewnątrz pętli while. 

Przykładowy wykres.


R obsługuje pliki w formacie .csv, wbudowane jest wiele testów statystycznych, a funkcjonalność poszerzają liczne dodatkowe biblioteki dostępne w internecie (instalacja jest prosta: wpisujemy install.packages("nazwa_biblioteki"), następnie wybieramy serwer, z którego chcemy pobrać pakiet (znajomość stref czasowych jest przydatna - wybieramy serwer znajdujący się w miejscu, gdzie internauci akurat śpią) i pamiętamy, żeby przed użyciem komendy oferowanej przez daną bibliotekę uruchomić ją komendą library("nazwa_biblioteki")). Niestety, biblioteki nie są kompatybilne z polską wersją programu, jednak język można dość łatwo zmienić.

Początkującym statystykom polecam szczególnie zainstalować pakiet nortest, zawierający test Andersona-Darlinga (ad.test), dzięki czemu nie będziemy skazani na niedokładności testu Kołmogorowa-Smirnova (ks.test).

Podsumowując, R jest stosunkowo prostym (jestem w stanie posługiwać się nim w miarę biegle, mimo, że jedyne lekcje programowania przed studiami zaliczyłem na kółku informatycznym w podstawówce/gimnazjum w programie LOGO, w czasach Windowsa 95/98, dyskietek i dinozaurów czających się w drodze do szkoły), łatwo dostępnym (wystarczy dostęp do internetu, choćby Twoje laboratorium znajdowało się w Ugandzie) i, co najważniejsze, szczególnie dla młodych naukowców, darmowym programem, oferującym szeroką gamę możliwości.





niedziela, 21 października 2012

Gen gwiazdą popkultury.

Historię poniższą opowiedział nam niedawno wykładowca na biochemii klinicznej jako przykład skłonności ludzi do wierzenia, że za wszystko odpowiadają geny. Poznajmy głównego bohatera opowieści, Robina Cooka:
(źródło - pl.wikipedia.org)

Robin Cook jest lekarzem, jednak bardziej znany jest jako pisarz, "król thrillera medycznego". Świat biotechnologów dzieli się na tych, którzy czytali jego książki i tych, którzy kłamią, twierdząc że nie czytali (ja jak dotąd przeczytałem tylko Niebezpieczną Grę, przy okazji brawa dla tłumacza - książka ta w oryginale nazywa się Cure).

W roku 2005 Robin Cook napisał książkę Marker (warning - spoilers ahead) Główna bohaterka, dr Laurie Montgomery odkrywa, że pacjenci, będący nosicielami zmutowanej kopii genu MEF2A są mordowani przez firmę ubezpieczeniową, aby uniknąć wypłaty odszkodowań w przypadku, gdyby dostali ataku serca.
(end of spoilers) 
Profesor, który opowiadał nam tę historię przypuszcza, że Cook (który przypomnę, jest lekarzem, a nie biotechnologiem/genetykiem - różnica o tyle istotna, że wielu pracowników laboratoriów uważa, że lekarz w labie to nieszczęście gorsze od inspekcji sanepidu, masowej ucieczki szczurów, wizyty studentów i odkrycia przez szefa, że przeglądamy kwejka w pracy razem wziętych) zbierając materiały do powieści, postąpił jak każdy szanujący się medyk, tzn. zajrzał na PubMed i znalazł tam artykuł Altshulera i Hirschhorna. Następnie postąpił nieco podobnie do Dana Browna, ewentualnie studentów piszących prezentację na zajęcia, tzn. przeczytał tytuł i (niezbyt dokładnie) abstract. Bowiem już z abstractu możemy wyczytać, że Only 1 CAD patient was found to carry a missense mutation not found in controls. W pełnej wersji artykułu możemy przeczytać m.in. że opisana mutacja była sprzężona z chorobą niedokrwienną serca tylko u jednej rodziny, w której występowały dodatkowo inne czynniki ryzyka. Statystyka okazała się z kolei bezlitosna dla badań na większej grupie pacjentów (The current estimate of the difference in the prevalence of nonsynonymous change between CAD and control patients (5 of 500 versus 0 of 500, respectively) does not achieve nominal significance (P > 0.2)*). No cóż... Czytelnicy raczej na PubMed nie zaglądają, z wyjątkiem tych najbardziej upier... dociekliwych. Zresztą, nie tyczy się to tylko thrillera medycznego, wystarczy wspomnieć kwiatki sadzone dość obficie w książkach wspomnianego już Dana Browna. Z drugiej strony, ciężko by było napisać książkę/nakręcić film, trzymając się ściśle prawdziwych wytycznych.

(źródło: xkcd.com)

Przy okazji, przypomina mi się opowieść jednego z panów z naszej sądówki, który mówił, że kupili kiedyś maszynę "taką jak w CSI"** służącą do poszukiwania ciał pod ziemią. Po jakimś czasie zadzwonili do sprzedawcy z pytaniem, dlaczego w serialu na monitorze widać szkielety, natomiast u nich widać jedynie niewyraźne zarysy. Sprzedawca cierpliwie wyjaśnił im różnicę między prawdą czasu a prawdą ekranu, po czym dodał, że nie oni pierwsi dzwonią do niego w tej sprawie...


A tak na koniec dodam jeszcze, że pisanie thrillerów medycznych/kryminałów może być ciekawą alternatywą, (względnie dodatkiem do pensji) gdyby wyrzucili nas z laboratorium*** ;)



* Dla mniej biegłych w statystyce podaję, że wartość p, czy jak to się u nas mówi "piwalju", powinna wynosić poniżej 0,05, aby można było uznać badanie za istotne.
** Tak, na medycynie sądowej oglądają CSI. Co więcej, podczas zajęć z chirurgii odkryliśmy w kanciapie prowadzących dr House'a na DVD. Przypuszczamy, że na anatomii oglądają Kości, a u ginekologów woleliśmy nie sprawdzać.
*** Autor tylko się odgraża, na napisanie książki jest zdecydowanie za leniwy, o czym może świadczyć fakt, że powyższą notkę pisał z przerwami przez półtora tygodnia. 

piątek, 19 października 2012

No to jadziem...

Badania ruszyły pełną parą, oto parę symptomów, na podstawie których można to stwierdzić:
(kolejność przypadkowa)

1) Mamy własną kanciapę nad laboratorium. (napis na drzwiach dumnie głosi "Pokój Asystencki")
2) Dostaliśmy kod do drzwi Zakładu. Jak dotąd najlepszą stroną tego faktu są pełne szacunku spojrzenia studentów czekających na korytarzu na  kogoś, kto wpuści ich do środka. My tego nie robimy - niech czekają!
3) W przyszpitalnym Lidlu znów mają żelkowe myszy. Ulubiony przysmak laborantów.
4) Zarząd STN wyciągnął łapsko po składkę.
4) Wprawiamy się w rozcieraniu mysich oczu i izolacji z nich RNA, izolujemy komórki macierzyste z krwi pępowinowej.
5) Kłujemy się potencjalnie skażonymi igłami...
Wróć. Nie my się kłujemy, chroni nas znane od wielu lat prawo Murphy'ego, które przed chwilą wymyśliłem, mówiące, że niedoświadczonym pracownikom nic złego się nie przytrafia, tylko dlatego aby, pozostawieni sami sobie, mogli spowodować katastrofę. Lub w prostszej wersji - Szlag zawsze trafia głowę zespołu. :P
Zakłucie w każdym razie nie było zbyt wielkie, krew, wprawdzie pępowinowa to jednak krew, traktujemy ją jakby była skażona HIV, co najmniej dwoma różnymi WZW i czym tam kto woli. Przepisy BHP poszły w ruch, protokół, zabezpieczenie resztek krwi do zbadania - pierwszy raz zobaczyliśmy jak to wszystko działa w praktyce. Wszystko zadziałało sprawnie.
Problem leżał jednak w czym innym: zostaliśmy we dwójkę z krwią od dwóch innych noworodków. Siedzieliśmy naprzeciw tych dwóch falconów i zerkaliśmy na siebie nieufnie.
(przy okazji: wspomniana wyżej krew od początku była pechowa, między innymi nie chciała się zwirować jak trzeba czy zawierała znacznie mniej komórek, niż dwie pozostałe - mamy nadzieję, że dziecko nie będzie równie pechowe...).
Z jednej strony szkoda przerywać izolację w połowie, z drugiej, robimy to pierwszy raz, i w dodatku musimy to zrobić sami. Od czego jednak jest instrukcja dołączona do zestawu (tak, na to też jest zestaw) i życzliwi ludzie, którzy napisali nam jej "wersję dla początkujących". Pomimo drobnych, acz nietypowych problemów z wirówką*, która:
- jednej osobie się nie otwiera, a drugiej nie zamyka (trzeba dobrze się w pary dobierać - aż się prosi, żeby wyliczyć statystyczne prawdopodobieństwo, że dobierze się para której wirówka się nie zamknie i nie otworzy :P)
- podczas wirowania, pomimo dokładnego ustalenia równowagi probówek trzęsie całym blatem, na którym jest ustawiona
- w pewnym momencie stwierdza, że okazujemy jej za mało czułości i zaczyna przerywać wirowanie komunikatem "Imbalance", do momentu, aż ktoś się do niej nie przytuli. W takim układzie jest w stanie wirować łaskawie dalej.

Ostatecznie, po zrobieniu jednego z wirowań na trzy raty (przytulanie się do wirówki przez 10 minut nie tylko jest męczące, ale do tego osobliwie wygląda), przesiedliśmy się na inne urządzenie znanej firmy E. (w sumie, jeśli się wspomni o firmie produkującej sprzęt laboratoryjny na E, to i tak każdy wie o jaką firmę chodzi), które nie zdążyło jeszcze osiągnąć takiego stadium ewolucji i nie żąda okazywania uczuć.
Odczynniki staraliśmy się dodawać w odpowiednich proporcjach podanych w instrukcji dla żółtodziobów, lub stosownie tę instrukcję modyfikować i uzupełniać. Wyizolowane komórki macierzyste zanieśliśmy na sorter, i sądząc z tego, że kiedy dzisiaj siedziałem w laboratorium pomagając przy izolacji RNA (kolejne prawo Murphy'ego: kiedy już założysz rękawiczki i nie możesz dotykać niczego, w czym mogą się czaić RNA-zy, prawdopodobieństwo, że coś zacznie cię swędzieć, wynosi 100%) zostały mi przekazane gratulacje, najwyraźniej nic nie zepsuliśmy**.

*Autor widział w życiu rozmaite wirówki, aczkolwiek jego ulubioną jest wirówka Sorvall RC-5B, ustrojstwo większe od przeciętnej pralki, mające futurystyczny design a la Gwiazda Śmierci (im coś ma więcej światełek, tym jest nowocześniejsze), które, źle potraktowane nie bawi się w żadne komunikaty "Imbalance", lecz od razu wchodzi w nadprzestrzeń.
** Zjawisko określane w grach RPG jako "szczęście nooba"

wtorek, 9 października 2012

Początek - któryś z kolei.


Rok akademicki 2011/12 upłynął nam w kole naukowym pod znakiem nabywania umiejętności praktycznych głównie z zakresu immunohistochemii. Szeregi alkoholowe były naszymi przyjaciółmi - ale oczywiście tylko w naukowym tego słowa znaczeniu.... Zahaczyliśmy o blotting, konfokal czy zwięrzęta laboratoryjne a wszystko po to by w tym roku zająć się czymś własnym.

Tak więc - wszystkie drogi prowadzą na dywan do Profesora - ewentualnie przez ten dywan. I wczoraj przez ten dywan się przetoczyliśmy. Łatwo nie było... :)
Ale rokowania przeżycia pięcioletniego są dobre :)
Będzie się działo. Będzie samodzielna praca, będzie materiał na konferencję, będą konferencje.
Mamy pracować ciężko, w pocie czoła generować wyniki, rozwiązania i wnioski.
Ale dzięki temu nasza droga do Nobla skróciła się o ten jeden krok. :)