Problematika sustava medicinskih klasifikacija i sustava šifriranja u nastavi medicinske informatike
Mladen Petrovečki
Katedra za informatiku, Medicinski fakultet Sveučilišta u Rijeci, Ulica braće Branchetta 20, 51000 Rijeka
E. pošta: mladenp@medri.hr
Sažetak. U radu se sažeto i pregledno iznose osnovne informatičke postavke medicinskih sustava klasifikacija i šifriranja koje dodiplomski studenti sadržajno izučavaju u tijeku cjelokupnog studija medicine, a koji u formalnom smislu pripadaju nastavi kolegija medicinske informatike. Klasifikacijski sustavi opisani su jednostavnim, hijerarhijskim i višestrukim (složenim) podjelama, a sustavi šifriranja prikazani su opisom brojčanih, hijerarhijskih i jukstapozicijskih šifri. Temeljne postavke prikazanih sustava važno je spoznati radi razumijevanja složenosti medicinskog jezika priopćavanja.
Abstract. Teaching Medical Informatics: Basic on Medical Coding and Classification Systems. Basic informatical concept of medical classification systems and coding systems is briefly reviewed in this paper. Medical properties and usage of systems as such are experienced during the graduate study of medicine, but conceptual properties should be the part of medical informatics curriculum to explain at least fundamental properties of complex medical language considered as a communication system.
1. Medicinski jezik
Usporedno s razvojem medicinske znanosti razvijao se i specifičan jezik međusobnog sporazumijevanja liječnika i drugih medicinskih znanstvenika - medicinski jezik, koji danas oblikuje izrazito dinamičan sustav koji studenti medicine uče i svladavaju tijekom dogotrajnog studija usporedno s medicinskim činjenicama, ali i sami liječnici u tijeku cijeloga radnog vijeka. Obuhvaća brojne sustave imenovanja dijelova ljudskog tijela, organa i tkiva, sve do razine dijelova stanice pa i dublje, nazive funkcija i specifičnih postupaka koji se u tim sustavima ostvaruju, te imena svih promijenjenih funkcija i stanja koja se razlikuju od uobičajenih. Napredak interdisciplinarnih znanosti i njihovo stapanje s medicinom rezultira proširenjem nazivlja, pa medicinski jezik sve više obiluje pojmovima iz područja kao što su fizika, kemija, biologija, informatika, matematika, statistika, etika i sociologija.
Iako medicinski jezik gradi izrazito složen, zahtjevan i specifičan rječnik, brojne medicinske činjenice još uvijek je teško precizno, jednoznačno i točno opisati i definirati (npr. postojanje istoznačnosti, imenodavalaštva, mnogoznačnosti i istozvučnosti). To dakako ne spriječava liječnike u komuniciranju nego čak razmjenu obavijesti može činiti bogatijom i zanimljivijom, no zasigurno otežava uvođenje informatičkih postupaka u medicinsku znanost [1] . Stoga se za potrebe preciznog komuniciranja, napose postupcima koje uvodi uporaba elektroničkih računala, medicinski jezik mora maksimalno standardizirati, što se postiže uvođenjem (a) jasnog tumačenja medicinskih pojmova i izraza, i (b) njihovih podjela. Medicinski pojam (engl. concept) je zamisao, mišljenje ili stav o nečemu, shvaćanje i nacrt nekog sustava ili entiteta, a tumačimo ga kao rezultat apstrakcije razmišljanja o tom sustavu. Izraz (engl. term) je termin, riječ ili definirani skup riječi koji iskazuju mišljenje ili stav o nečemu, ili jednostavnije, medicinski izraz je jezikoslovno predočenje medicinskog pojma [2] . Skup svih postojećih medicinskih izraza oblikuje medicinsku terminologiju koju u informatici sustavno prikazujemo, opisujemo i standardiziramo rječnicima, nomenklaturama, tezaurusima, indeksima, klasifikacijama, katalozima i šifriranjem [ 2-4] . U ovom je prikazu pozornost usmjerena ka prikazu postavki klasifikacija i sustava šifriranja.
Klasifikacija je sustavno razdjeljivanje ili udruživanje predmeta ili pojmova po skupinama, klasama, razredima i odjelima, a prema njihovim općim značajkama koje ih međusobno razlikuju ili po kojima su međusobno slični. Klasifikaciji srodni ili istoznačni pojmovi su kategorizacija, podjela, raspodjela, grupiranje, razvrstavanje, svrstavanje i uvrštavanje, a znanstvena disciplina koja izučava teorijska načela, pravila i postupke klasifikacija naziva se taksonomija [5] .
Aristotelovo klasično poimanje klasifikacija predstavlja deterministički koncept, kod kojeg sve jedinke neke skupine moraju imati iste osobine. Deterministički koncept primjenjuje se kod pojmova koje možemo jednostavno definirati, pa time i razlikovati (npr. spol bolesnika). Odrednice složenih pojmova (npr. jačina bola) onemogućuju primjenu jednostavnih pravila klasifikacije, pa se jedinke grupiraju prema sličnosti, a ne jednakosti. Takav se koncept naziva probabilističkim [2] .
Medicinska znanost obiluje probabilističkim klasifikacijama s ciljem postizanja što je moguće boljeg udruživanja srodnih pojmova, a istodobno maksimalnog razlikovanja nesrodnih. Osnovna svrha takvih postupaka je uvođenje reda u sustave, te posljedično logično predstavljanje, prikazivanje i reproduciranje podataka, ali i priprema za njihovu elektroničku obradu [1] . Klasifikacijama se oblikuje okvir cjelovitog i sustavnog prikaza znanja nekog znanstvenog područja, pa stoga svaka od njih mora biti potpuno jasne građe.
Skup logičkih odrednica kojima određujemo kako i po kojim svojstvima će se neke jedinke klasificirati naziva se pravilo klasifikacije (engl. classification rule). U zavisnosti od broja pravila koja se primjenjuju, klasifikacije mogu biti jednostavne i složene. Kod jednostavnih (jednostrukih) klasifikacije postoji samo jedno pravilo podjele, dok složene karakterizira primjena dva ili više klasifikacijskih pravila, i to (a) sukcesivno, pa govorimo o hijerarhijskim (monoaksijalnim) klasifikacijama, ili (b) usporedno, pa govorimo o višestrukim (multiaksijalnim ili multifasetnim) klasifikacijama [ 2,5] .
2.1. Jednostavne klasifikacije
Jednostavne klasifikacije definira primjena jednog pravila razvrstavanja, a broj podskupina ovisi samo o pravilu (npr. Ann-Arbor klasifikacija [ 6] , prema kojoj se zloćudni limfomi dijele u četiri klinička stupnja). Pravilo klasifikacije mora biti poznato, jasno, razumljivo i primjenjivo na sve jedinke sustava koji se klasificira. Ako pravilo ne zadovoljava sve navedene uvjete, onda se ni klasifikacija ne može ostvariti ili će, ako se s njom započne, biti netočna i nepotpuna. Znanstvenici mogu rabiti postojeća pravila (kao opisano, objavljeno) ili će pravila oblikovati sami i prikazati ih zajedno s prikazom klasifikacije. Pokazatelj koji određuje pravilo klasifikacije naziva se razlikovni kriterij.
2.2. Hijerarhijske klasifikacije
Klasifikacijska pravila se u ovih podjela primjenjuju u nizu (sukcesivno), tj. svaka podskupina nastala jednom podjelom može se dalje klasificirati sljedećom. Jedinke neke cjeline se prema najvažnijem svojstvu primjenom prvog pravila klasificiraju u glavne razrede ili skupine, a nakon toga se jedinke glavnih razreda klasificiraju u podrazrede prema drugom svojstvu primjenom drugog pravila, pa pod-podrazrede prema sljedećem svojstvu primjenom sljedećeg pravila, itd. Dubina i širina podjele nisu ograničene, no sljedeća pravila moraju biti zadovoljena: (a) svaka jedinka sustava mora imati mogućnost da bude klasificirana, (b) mora biti klasificirana, i (c) nakon klasifikacije može pripadati samo jednom razredu.
Veze između klasificiranih jedinka nazivaju se veze značenja ili semantičke veze. Semantičke veze hijerarhijski klasificiranih pojmova moguće su samo prema prethodnim (nadređenim) razredima i sljedbenim (podređenim) razredima, ali ih nema između razreda iste razine. Raščlamba semantičkih veza u informatici je napose važna kod sustava za pomoć u odlučivanju [2,7]. U medicini najpoznatija hijerarhijska klasifikacija je Međunarodna klasifikacija bolesti (MKB, [8]).
2.3. Višestruke klasifikacije
Osobitost višestrukih (multiaksijalnih) klasifikacija je istodobna primjena nekoliko klasifikacijskih pravila na istom skupu jedinki. Pritom nastaju podskupine koje se ne mogu jednostavno prikazati u zajedničkom hijerarhijskom odnosu, nego se oblikuje složeni, tzv. jukstapozicijski prikaz, u kojem svaku jedinku definiraju osobitosti svih razreda kojima pripada.
Osnovna pravila višestrukih klasifikacija su sljedeća: (a) svaka jedinka sustava mora imati mogućnost da bude klasificirana prema svim pravilima, (b) mora biti klasificirana prema svim pravilima, (c) nakon klasifikacije mora pripadati u onoliko razreda niže klase koliko je pravila primijenjeno, i (d) ne smije pripadati u više razreda istog klasifikacijskog pravila. Ukupan broj mogućih kombinacija višestruko klasificiranih jedinki jednak je umnošku broja razreda svih podjela. Tipičan primjer višestruke klasifikacije je Sustavna medicinska nomenklatura (SNOMED, Systematized Nomenclature of Medicine, [ 9] ).
I kod višestrukih klasifikacija su semantičke veze pojmova moguće samo prema nadređenim i podređenim razredima svake od podjela zasebno jer jukstapozicijska nomenklatura sama po sebi nije dostatna za izražavanje veza tipa "ima", "uzrokuje" ili "je posljedica", no struktura podjele je povoljna za takvu nadgradnju [ 3] .
Šifriranjem se u informatici definira zamjena jedne skupine znakova, riječi ili skupova riječi drugom skupinom znakova ili riječi koja je u pravilu manja i naziva se šifra. Zaliha znakova pritom se u pravilu mijenja, najčešće u smislu maksimalnog sužavanja broja znakova s kojima raspolažemo za šifriranje [ 5] . U engleskom govornom području šifriranje se naziva kodiranje (engl. coding ili codifying), a šifra kôd (engl. code). Dobar sustav šifriranja medicinskog nazivlja morao bi uvijek zadovoljavati pravilo "jedan pojam - jedna šifra". Samo će tako uporaba sustava oblikovati jasnu i nedvosmislenu informaciju kao temelj pouzdanog medicinskog priopćavanja.
3.1. Šifrarnik
Propis šifriranja u medicini se najčešće ne može definirati nekim matematičkim algoritmom, osim ako razlog šifriranja nije tajnopis, tj. potreba da poruka bude gramatički besmislena i semantički nerazumljiva svima osim pošiljatelju i primatelju. Stoga se u svrhu šifriranja mora obznaniti šifrarnik, tj. tiskani ili elektronički zapis koji u nekom logičkom slijedu niže pojmove koji se šifriraju, te zajedno s njima njihove šifre [ 2-4] . Primjer takvog sustava šifriranja u medicini je već spomenuta MKB.
3.2. Šifre
Šifre se u djelokrugu informatike najčešće oblikuju uporabom brojeva, slova abecede i znakova alfanumeričkih skupova. Postoji nekoliko definiranih vrsta, od kojih su za medicinsku znanost od važnosti brojčane, mnemonične, hijerarhijske i jukstapozicijske šifre.
3.2.1. Brojčane šifre
Brojčane šifre oblikuju se uporabom brojevnih sustava, najčešće dekadskog, a ponekad i binarnog, a brojevi koji se pridružuju medicinskim pojmovima mogu se stvarati na nekoliko načina [ 5] . Serijsko stvaranje brojeva znači da svaki novi pojam ili klasifikacijska skupina dobiva sljedeći slobodni broj u rastućem nizu. Dobra strana ovakvog sustava šifriranja je neograničenost dodavanja novih šifri. Sustav sličan navedenom je serijsko šifriranja s unaprijed zadanim rasponom brojeva. Osnovni nedostatak takvog šifriranja je nemogućnost proširivanja zadanih raspona brojeva.
Randomizirano brojčano šifriranje znači da svaki pojam dobija slučajno odabrani broj iz nekog unaprijed zadanog raspona brojeva. Rabi se najčešće u svrhu maskiranja ispitanika i istraživača u tijeku sprovođenja slijepih pokusa, tako da se osnovna informacija o šifriranom subjektu ni na koji način ne bi mogla povezati sa šifrom. Pri randomiziranom šifriranju pozornost treba obratiti na mogućnost da se za novi pojam generira isti slučajni broj, što se ne smije dogoditi.
Šifriranje brojevima binarnog sustava rabi se pri brojčanom označavanju binariziranih pokazatelja, kod kojih se stanje može označiti s da (1) i ne (0).
3.2.2. Mnemonične šifre
Mnemonične šifre oblikuju se s nekoliko znakova koji se lako pamte i poput kratice upućuju na pojam koji se šifrira, a rabe u pravilu alfanumeričku zalihu znakova. Rabe se samo za šifriranje manjih skupina pojmova jer u suprotnom postaju prevelike i ne mogu se pamtiti, pa samim time gube smisao (npr. JIL, jedinica intenzivnog liječenja).
3.2.3. Hijerarhijske šifre
Struktura hijerarhijskih šifra podudarna je strukturi hijerarhijskih klasifikacija, samo su klasificirani pojmovi prikazani šifrirano, a ne u izvornom obliku. Hijerarhijske šifre se oblikuju tako da se nekoj osnovnoj šifri pridodaje šifra podskupine, pod-podskupine, i tako redom sve do razine zadnje klasifikacije. Prednost hijerarhijskih šifra je neograničenost proširenja i pregledna strukturiranost, što je i razlog da takav šifrarnik kao standard rabi već spomenuta MKB.
3.2.4. Jukstapozicijske šifre
Jukstapozicijske šifre nastaju redanjem ili nizanjem šifra pojmova koji su klasificirani višestrukim podjelama, pa im je struktura podudarna (npr. SNOMED-ova šifra).
4. Medicinske klasifikacije i sustavi šifriranja
Nosologija izučava postavke klasifikacija bolesti, no danas podrazumijeva i raščlambu znakova bolesti (simptoma), skupina simptoma (sindroma), poremećaja i ozljeda, pa se sve češće opisuje kao taksonomija sustava dijagnostičkog nazivlja (za razliku od semiologije koja izučava znakove bolesti kao takve, nezavisno od klasifikacijskih sustava). Nosološki problemi napose izrastaju uvođenjem medicinskih informacijskih sustava u uporabu, jer se tek tada može spoznati stvarna problematika standardizacije medicinskog jezika, tj. koliko neki uobičajeni i svakodnevni medicinski izrazi nemaju jasno i pročišćeno značenje (npr. jasno semantičko razlučivanje medicinskih pojmova simptom, sindrom, bolest, oboljenje i poremećaj). Standardni medicinski klasifikacijski sustavi (tablica 1, [5,10-14]) rješavaju samo dio navedene problematike. Oni nisu zamišljeni s istim ciljem i niti jedan od njih nije svukupan i istinski cjelovit (iako se takvima pokušavaju oblikovati), a to i jest razlogom da se svi rabe istodobno. Neki od sustava standardno se udružuju u tzv. skupine (engl. family) klasifikacija bolesti i srodnih stanja ne bi li se navedeni problem donekle riješio [1,3] .
Tablica 1. Medicinski klasifikacijski sustavi koje dodiplomski studenti sadržajno izučavaju u tijeku redovitog studija medicine, a s kojima se u formalnom smislu moraju upoznati na nastavi medicinske informatike |
|||
Klasifikacija/šifrarnik | Oznaka | Vrsta klasifikacije | Struktura šifre |
Međunarodna klasifikacija bolesti | ICD (hrv. MKB) | hijerarhijska | Sbb.b |
Međunarodna klasifikacija onkoloških bolesti | ICD-O (MKB-O) | dvoaksijalna | Mbbbb/b |
Međunarodna klasifikacija medicinskih postupaka | ICPM | hijerarhijska | bbbbb |
Popis dijagnostičkih i terapijskih postupaka* | “Plava knjiga” | hijerarhijska | bbbbb |
Sustavna medicinska nomenklatura | SNOMED | višestruka/hijerarhijska | S-bbbbb |
Anatomsko-terapijsko-kemijska klasifikacija lijekova | ATC (ATK) | hijerarhijska | S bb S S |
Popis medicinskih odrednica (tezaurus) | MeSH | hijerarhijska | Sb.b.b… |
Readova klinička klasifikacija | RCC | hijerarhijska | Sbbbb |
TNM-klasifikacija | TNM | višestruka | TxNxMx |
Međunarodna klasifikacija mentalnih poremećaja | DSM | višestruka | bbb.bb |
Oznake u tablici: S – slovna oznaka kategorije, b – brojčana oznaka (znamenka), x – brojčana ili slovna oznaka; Ostale slovne oznake (M, T i N) strukture šifre su nepromijenjive i stalne. *Popis dijagnostičkih i terapijskih postupaka u zdravstvenim djelatnostima prerađena je i za Hrvatsku prilagođena i nadopunjena inačica Međunarodne klasifikacije medicinskih postupaka [ 13] . |
Klasifikacijski sustavi u medicinski jezik uvode red, svaki od njih s određenom specifičnošću i usmjerenjem, a sustavi šifriranja omogućuju sprovođenje informatičkih postupaka. Neke se klasifikacije djelomično podudaraju, dok se neke međusobno nadopunjuju [ 2,5] . Da bi se što više njih moglo uklopiti u jedinstvenu funkcionalnu cjelinu, programska potpora informacijskih sustava mora razviti postupke prevođenja pojmova sa šiframa iz jednog sustava u drugi (transkripcija, engl. transcoding). U objedinjavanju se pritom rabe prednosti svakog od sustava (npr. dobra strukturiranost MKB, opsežna mogućnost ekspresije medicinskih pojmova SNOMED-a [8,9], i sl.).
Glede informatičkih problema koji se pojavljuju u klasifikacijama neka zapažanja treba istaknuti. Sustavi moraju biti jednostavno nadogradivi i većina njih jest, no količinu i širinu medicinskog znanja nije jednostavno predvidjeti, pa su korjenite revizije sustava ponekad neizbježne (npr. prijelaz s MKB-9 na MKB-10). Promjene sadržaja također moraju biti omogućene na način kako to primjerice radi MeSH, gdje se godišnje dodaje ali i briše cijeli niz odrednica, a nekima se mijenja mjesto u klasifikaciji. Nadalje, jedan entitet može se i mora nalaziti (a) samo u jednoj i (b) barem u jednoj klasificiranoj podskupini (pravilo međusobne isključivosti). Pravilo "samo u jednoj" neki sustavi ne poštuju u potpunosti (MeSH), što dovodi do redundancije, dok se pravilo "barem u jednoj" najčešće rješava tako da se za entitet s nedovoljno poznatim osobinama jednostavno stvara vlastita klasifikacijska skupina koja sustav opterećuje (tipično za MKB, [8]).
Problematiku šifriranja danas tek manjim dijelom rješava programska potpora za automatsko prevođenje tekstovnog medicinskog zapisa u šifre s pomoću nekog od klasifikacijskih sustava [ 15] . Takva je potpora još uvijek u začecima i razvija se u pravilu samo za englesko govorno područje, pa najveći dio posla još uvijek obavljaju ljudi. Gdje god je moguće, šifriranje se povjerava posebnim službama koje rabe informatičku programsku potporu, tj. računalne datoteke u kojima se brzo pronalaze traženi medicinski pojmovi, izrazi i njihove šifre. Takvi sustavi djelomično i nadziru upis šifra onemogućujući unos nepostojećih, tj. onih koje u datotekama nisu već unaprijed zadane.