Kuidas tehisintellektile teadlik lähenemine vähendab kallutatud andmekogumeid

Kallutatud andmekogumid ja eetiline tehisintellekt

AI-põhised lahendused vajavad tõhusaks toimimiseks andmekogumeid. Ja nende andmekogumite loomine on täis süstemaatilisel tasandil kaudse kallutatuse probleemi. Kõik inimesed kannatavad eelarvamuste all (nii teadlikud kui ka alateadlikud). Eelarvamused võivad esineda mitmel kujul: geograafilised, keelelised, sotsiaalmajanduslikud, seksistlikud ja rassistlikud. Ja need süstemaatilised eelarvamused lisatakse andmetesse, mille tulemuseks võivad olla AI-tooted, mis säilitavad ja suurendavad eelarvamusi. Organisatsioonid vajavad teadlikku lähenemist, et leevendada andmekogumitesse hiiliva eelarvamusi.

Näited, mis illustreerivad eelarvamuste probleemi

Üks märkimisväärne näide selle andmekogumi eelarvamuste kohta, mis kogusid tol ajal palju negatiivset ajakirjandust, oli lugemise jätkamise lahendus, mis eelistas meessoost kandidaate naistele. Selle põhjuseks on asjaolu, et värbamistööriista andmekogud töötati välja, kasutades viimase kümnendi elulookirjeldusi, mil enamik taotlejatest olid mehed. Andmed olid kallutatud ja tulemused peegeldasid seda eelarvamust. 

Veel üks laialdaselt kajastatud näide: Google jagas Google'i iga-aastasel I/O arendajate konverentsil eelvaadet tehisintellektil töötavast dermatoloogia abitööriistast, mis aitab inimestel mõista, mis toimub nende naha, juuste ja küüntega seotud probleemidega. Dermatoloogia assistent rõhutab, kuidas tehisintellekt areneb, et aidata tervishoius, kuid rõhutas ka võimalust, et tehisintellekti võib kalduda kriitiliselt, et tööriist ei sobi värviliste inimeste jaoks.

Kui Google tööriistast välja kuulutas, märkis ettevõte:

Veendumaks, et ehitame kõigi jaoks, võtab meie mudel arvesse selliseid tegureid nagu vanus, sugu, rass ja nahatüübid – alates kahvatust nahast, mis ei päevitu, kuni pruuni nahani, mis harva põleb.

Google, AI kasutamine tavalistele nahahaigustele vastuste leidmiseks

Kuid Vice'i artiklis öeldi, et Google ei suutnud kasutada kaasavat andmekogumit:

Ülesande täitmiseks kasutasid teadlased koolitusandmestikku, mis koosnes 64,837 12,399 pildist 3.5 90 patsiendist, kes paiknesid kahes osariigis. Kuid tuhandetest pildil olevatest nahahaigustest pärines ainult XNUMX protsenti Fitzpatricku nahatüüpide V ja VI patsientidelt – vastavalt pruuni naha ja tumepruuni või musta nahaga patsientidelt. Uuringu kohaselt koosnes XNUMX protsenti andmebaasist heleda naha, tumedama valge naha või helepruuni nahaga inimesed. Kallutatud proovide võtmise tulemusena ütlevad dermatoloogid, et rakendus võib lõpuks üle- või aladiagnoosida inimesi, kes pole valged.

Vice, Google'i uus dermatoloogiarakendus ei olnud mõeldud tumedama nahaga inimestele

Google vastas, et täpsustab tööriista enne selle ametlikku avaldamist:

Meie tehisintellektiga töötav dermatoloogia abitööriist on enam kui kolmeaastase uurimistöö kulminatsioon. Alates sellest, kui meie tööd kajastati ajakirjas Nature Medicine, oleme jätkanud oma tehnoloogia arendamist ja täiustamist, lisades täiendavaid andmekogumeid, mis sisaldavad tuhandete inimeste annetatud andmeid ja miljoneid rohkem kureeritud nahaprobleemide pilte.

Google, AI kasutamine tavalistele nahahaigustele vastuste leidmiseks

Nii palju kui me lootsime, et tehisintellekt ja masinõppeprogrammid suudavad need eelarvamused korrigeerida, on reaalsus endiselt: need on ainult nutikas kuna nende andmekogumid on puhtad. Vana programmeerimislause värskenduses prügi sisse/prügi välja, AI lahendused on ainult nii tugevad, kui palju on nende andmekogumite kvaliteet algusest peale. Ilma programmeerijate paranduseta pole neil andmekogumitel taustakogemust, et end ise parandada – kuna neil lihtsalt pole muud tugiraamistikku.

Andmekogumite vastutustundlik koostamine on kõige keskmes eetiline tehisintellekt. Ja inimesed on lahenduse keskmes. 

Teadlik tehisintellekt on eetiline AI

Eelarvamusi ei teki vaakumis. Ebaeetilised või kallutatud andmekogumid tulenevad valest lähenemisviisist arendusetapis. Eelarvamusvigade vastu võitlemise viis on võtta kasutusele vastutustundlik, inimkeskne lähenemisviis, mida paljud selles valdkonnas kutsuvad Mindful AI-ks. Teadlikul AI-l on kolm kriitilist komponenti:

1. Mindful AI on inimkeskne

Tehisintellekti projekti algusest peale planeerimisetappides peavad inimeste vajadused olema iga otsuse keskmes. Ja see tähendab kõiki inimesi – mitte ainult alamhulka. Sellepärast peavad arendajad toetuma mitmekesisele ülemaailmselt tegutsevate inimeste meeskonnale, et koolitada tehisintellekti rakendusi kaasavaks ja erapooletuks.

Andmekogumite koondamine globaalselt ja mitmekülgselt meeskonnalt tagab eelarvamuste varajase tuvastamise ja välja filtreerimise. Erinevate rahvuste, vanuserühmade, soo, haridustaseme, sotsiaal-majandusliku tausta ja asukohaga inimesed saavad hõlpsamini märgata andmekogumeid, mis eelistavad üht väärtuste kogumit teisele, vähendades seega soovimatut eelarvamust.

Vaadake häälrakendusi. Tähelepaneliku tehisintellekti lähenemisviisi rakendamisel ja ülemaailmse talentide kogumi võimsuse ärakasutamisel saavad arendajad andmekogumites arvesse võtta keelelisi elemente, nagu erinevad dialektid ja aktsendid.

Inimkeskse disainiraamistiku loomine algusest peale on kriitilise tähtsusega. See on kaugel selle tagamisel, et loodud, kureeritud ja märgistatud andmed vastavad lõppkasutajate ootustele. Kuid samuti on oluline hoida inimesi kursis kogu tootearenduse elutsükli jooksul. 

Inimesed selles ringis võivad aidata ka masinatel luua parema AI -kogemuse iga konkreetse vaatajaskonna jaoks. Ettevõttes Pactera EDGE mõistavad meie ülemaailmselt asuvad tehisintellekti andmeprojektide meeskonnad, kuidas erinevad kultuurid ja kontekstid võivad mõjutada usaldusväärsete tehisintellekti koolitusandmete kogumist ja kureerimist. Neil on vajalikud tööriistad probleemide märgistamiseks, jälgimiseks ja parandamiseks enne AI-põhise lahenduse kasutuselevõttu.

Human-in-the-loop AI on projekti "turvavõrk", mis ühendab inimeste tugevad küljed ja nende mitmekesine taust masinate kiire arvutusvõimsusega. See inimeste ja tehisintellekti koostöö tuleb luua programmide algusest peale, et kallutatud andmed ei moodustaks projekti alust. 

2. Teadlik tehisintellekt on vastutav

Vastutus seisneb selle tagamises, et tehisintellektisüsteemid oleksid eelarvamustevabad ja põhineksid eetikal. See tähendab, et tuleb meeles pidada, kuidas, miks ja kus andmeid luuakse, kuidas tehisintellektisüsteemid neid sünteesivad ja kuidas neid kasutatakse otsuste tegemisel, otsustel, millel võib olla eetilisi tagajärgi. Ettevõtte üks võimalus seda teha on töötada alaesindatud kogukondadega, et olla kaasavam ja vähem erapoolik. Andmete annotatsioonide valdkonnas toovad uued uuringud esile, kuidas mitme annotaatoriga mitme ülesande mudel, mis käsitleb iga annotaatori silte eraldi alamülesandena, võib aidata leevendada võimalikke probleeme, mis on omased tüüpilistele põhitõe meetoditele, mille puhul annotaatorite lahkarvamused võivad olla tingitud alaesindatusest ja võib jääda tähelepanuta annotatsioonide koondamisel ühele põhitõele. 

3. Usaldusväärne

Usaldusväärsus tuleneb sellest, et ettevõte on läbipaistev ja arusaadav selles osas, kuidas tehisintellekti mudelit koolitatakse, kuidas see töötab ja miks nad soovitavad tulemusi. Ettevõte vajab tehisintellekti lokaliseerimisega seotud teadmisi, et võimaldada klientidel muuta oma AI-rakendused kaasavamaks ja isikupärasemaks, võttes arvesse kohaliku keele ja kasutajakogemuse kriitilisi nüansse, mis võivad muuta tehisintellekti lahenduse usaldusväärsust ühest riigist teise. . Näiteks peaks ettevõte kujundama oma rakendused isikupärastatud ja lokaliseeritud kontekstis, sealhulgas häälpõhiste rakenduste keelte, murrete ja aktsentide jaoks. Nii pakub rakendus sama keerukuse taseme kõnekogemust igasse keelde, alates inglise keelest kuni alaesindatud keelteni.

Õiglus ja mitmekesisus

Lõppkokkuvõttes tagab tähelepanelik tehisintellekt, et lahendused põhinevad õiglastel ja mitmekesistel andmekogumitel, kus konkreetsete tulemuste tagajärgi ja mõju jälgitakse ja hinnatakse enne lahenduse turule tulekut. Olles tähelepanelik ja kaasates inimesi lahenduse igasse ossa, aitame tagada, et tehisintellekti mudelid püsivad puhtad, minimaalselt kallutatud ja võimalikult eetilised.

Mis sa arvad?

Sellel saidil kasutatakse rämpsposti vähendamiseks Akismetit. Vaadake, kuidas teie andmeid töödeldakse.