Wéi reduzéieren ech Halluzinatiounen an Ärer AI

Virun dräi Joer hunn ech eng zimlech interessant Konschtausstellung besicht. "Machine Memoirs" vum Refik Anadol huet mäin Interessi vun Ufank un gepickt.

Hien ass e populäre Numm bei deenen, déi un der Kräizung vu Konscht an AI interesséiert sinn. Ma maach der keng Suergen, dëse Blog geet net ëm Konscht. Mir verdéiwen an déi déif "Perceptioun" vun AI.

An dëser Ausstellung huet Anadol experimentéiert NASA's Weltraumfuerschungsbilder. D'Ausstellung gouf vun der Iddi inspiréiert datt Teleskope mat hire visuellen Archiven "dreemen" kënnen, an d'Barrièren tëscht Tatsaach a Phantasie verschwannen.

Andeems Dir d'Relatiounen tëscht Daten, Erënnerung a Geschicht op enger kosmescher Skala ënnersicht, huet d'Anadol eis gefrot d'Potenzial vun Kënschtlech Intelligenz d'Welt ronderëm eis ze beobachten an ze begräifen. An och AI fir seng eegen Dreem ze hunn ...

Also, firwat ass dat relevant fir eis?

Bedenkt dëst: sou wéi d'Anadol d'Konzept vun Teleskopen ënnersicht huet, déi aus hiren Donnéeën dreemen, hunn AI Systemer hiren eegenen Typ vun Dram - oder éischter, Halluzinatiounen - an hiren digitalen Erënnerungsbanken.

Dës Halluzinatiounen, wéi d'Visualiséierungen an der Anadol Ausstellung, kënnen eis hëllefen méi iwwer Daten, AI an hir Grenzen ze léieren.

Wat genee sinn AI Halluzinatiounen?

Wann e grousse Sproochemodell, wéi e generativen AI Chatbot, Ausgänge mat Mustere produzéiert déi entweder net existéierend oder onsichtbar fir mënschlech Beobachter sinn, nenne mir dës "AI Halluzinatiounen."

Dës Ausgänge, déi sech vun der erwaarter Äntwert ënnerscheeden op Basis vum Input, deen dem AI gëtt, kënne komplett falsch oder onsënneg sinn.

Am Kontext vu Computeren kann de Begrëff "Halluzinatioun" ongewéinlech schéngen, awer et beschreift genau de bizarre Charakter vun dëse falschen Ausgänge. AI Halluzinatioune ginn duerch eng Rei Variabelen verursaacht, dorënner Iwwerfitting, Biases an Trainingsdaten, an d'Komplexitéit vum AI Modell.

Fir besser ze verstoen, ass dëst konzeptuell ähnlech wéi d'Mënschen Formen a Wolleken oder Gesiichter um Mound gesinn.

E Beispill:

Ekran Goruntusu 2024 04 16 001841

An dësem Beispill hunn ech eng ganz einfach Fro gestallt Chat GPT. Ech sollt eng Äntwert kréien wéi: "Den Auteur vun der Dune Buchserie ass de Frank Herbert."

Firwat geschitt dat?

Och wa se gebaut gi fir Inhalt ze schreiwen dee kohärent a fléissend ass, sinn grouss Sproochmodeller tatsächlech net fäeg ze verstoen wat se soen. Dëst ass ganz kritesch fir d'Kredibilitéit vum AI-generéierten Inhalt ze bestëmmen.

Wärend dës Modeller Reaktiounen generéiere kënnen déi mënschlecht Verhalen mimikéieren, si feelen dem kontextuellen Bewosstsinn a kriteschen Denkenfäegkeeten déi tatsächlech Intelligenz ënnersträichen.

Als Resultat hunn AI-generéiert Ausgänge d'Gefor vu täuschend oder falsch ze sinn, well se passend Mustere favoriséieren iwwer sachlech Korrektheet.

Wat kéint e puer aner Fäll vu Halluzinatioune sinn?

Geféierlech falsch Informatioun: Loosst eis soen datt e generativen AI Chatbot Beweiser an Zeegnes fabrizéiert fir eng ëffentlech Figur vu kriminellen Verhalen falsch ze beschëllegt. Dës irreführend Informatioun huet d'Potenzial fir de Ruff vun der Persoun ze schueden an ongerechtfäerdegt Retaliatioun ze verursaachen.

Komesch oder grujheleg Äntwerten: Fir e humoristescht Beispill ze ginn, stellt Iech eng Foto vun engem Chatbot, deen engem Benotzer eng Wiederfro gëtt an äntwert mat enger Prognose, déi seet datt et Kazen an Hënn reent, zesumme mat Biller vu Reendrëpsen, déi wéi Kazen an Hënn ausgesinn. Och wa se witzeg sinn, wier dëst nach ëmmer eng "Halluzinatioun".

Tatsächlech Ongenauegkeeten: Gitt un datt e Sproochmodell-baséiert Chatbot falsch seet datt d'Grouss Mauer vu China aus dem Weltraum gekuckt ka ginn ouni z'erklären datt et nëmmen ënner spezifesche Konditiounen sichtbar ass. Och wann d'Bemierkung fir e puer plausibel schéngen kann, ass et ongenau a kann d'Leit iwwer d'Mauersiicht aus dem Weltraum täuschen.

Wéi vermeit Dir AI Halluzinatiounen als Benotzer?

Maacht explizit Prompts

Dir musst explizit mat AI Modeller kommunizéieren.

Denkt un Är Ziler an designt Är Uweisunge virum Schreiwen.

Zum Beispill, gitt spezifesch Instruktioune wéi "Erklärt wéi den Internet funktionnéiert a schreift e Paragraf iwwer seng Bedeitung an der moderner Gesellschaft" anstatt eng allgemeng Ufro ze stellen wéi "Sot mir iwwer den Internet."
Explizit hëlleft den AI Modell Är Intent ze interpretéieren.

Beispill: Stellt d'AI Froen wéi dës:

"Wat ass Cloud Computing, a wéi funktionnéiert et?"

"Erkläert den Impakt vun Datendrift op Modellleistung."

"Diskutéiert den Impakt an d'potenziell Zukunft vun der VR Technologie op den IT-Geschäft."

Ëmfaasst d'Kraaft vum Beispill

Beispiller an Ären Ufroen ubidden hëlleft AI Modeller de Kontext ze verstoen a präzis Äntwerten ze generéieren. Egal ob Dir no historeschen Abléck oder technesch Erklärungen sicht, Beispiller liwweren kënnen hëllefen d'Genauegkeet vum AI-generéierten Inhalt ze verbesseren.

Zum Beispill kënnt Dir soen, "Mentioun Fantasie Romaner wéi Harry Potter."

Komplex Aufgaben ofbriechen

Komplex Ufroen iwwerlaascht AI Algorithmen, a si kënnen zu irrelevanten Resultater féieren. Fir dëst ze vermeiden, trennt komplex Aktivitéiten a méi kleng, méi handhabbar Stécker. Andeems Dir Är Uweisunge sequentiell organiséiert, erlaabt Dir den AI onofhängeg op all Komponent ze fokusséieren, wat zu méi logesche Äntwerten resultéiert.

Zum Beispill, anstatt den AI ze froen "de Prozess z'erklären fir eng neural Netzwierk" an enger eenzeger Ufro, brécht d'Aufgab erof an diskret Phasen wéi Problemdefinitioun an Datesammlung.

Validéiert d'Output a gitt Feedback

Iwwerpréift ëmmer d'Resultater produzéiert vun AI Modeller, besonnesch fir Tatsaach-baséiert oder entscheedend Aktivitéiten. Vergläicht d'Äntwerten op zouverlässeg Quellen a notéiert all Differenzen oder Feeler.

Gitt Input zum AI System fir zukünfteg Leeschtung ze verbesseren an Halluzinatiounen ze reduzéieren.

Strategien fir Entwéckler fir AI Halluzinatiounen ze vermeiden

Ëmsetzen Retrieval-Augmented Generation (RAG).

Integréiert Retrieval-augmentéiert Generatiounstechniken an AI Systemer fir Äntwerten op sachleche Fakten aus zouverléissege Datenbanken ze baséieren.

Retrieval-augmented Generation (RAG) kombinéiert Standard natierlech Sproochgeneratioun mat der Kapazitéit fir relevant Informatioun aus enger rieseger Wëssensbasis ze kréien an ze integréieren, wat zu méi kontextuell räichen Output resultéiert.

Andeems Dir AI generéiert Inhalt mat validéierten Datequellen fusionéiert, kënnt Dir d'Zouverlässegkeet an d'Vertrauenswieregkeet vun den AI Resultater verbesseren.

Validéiert a Monitor AI Ausgänge kontinuéierlech

Setzt rigoréis Validatiounsprozeduren op fir d'Korrektheet an d'Konsistenz vun den AI-Output an Echtzäit z'iwwerpréiwen. Iwwerwaacht d'AI Leeschtung opmierksam, kuckt no potenziellen Halluzinatiounen oder Feeler, an iteréiert op Modelltraining a prompt Optimiséierung fir d'Verlässlechkeet mat der Zäit ze erhéijen.

Zum Beispill, benotzt automatiséiert Validatiounsroutinen fir AI-generéiert Inhalt fir sachlech Korrektheet ze kontrolléieren an Instanzen vu méigleche Halluzinatioune fir manuell Bewäertung ze markéieren.

Check Fir Data Drifts

Datedrift ass e Phänomen an deem d'statistesch Feature vun den Daten benotzt fir en AI Modell ze trainéieren mat der Zäit variéieren. Wann den AI Modell Daten entsprécht déi wesentlech vun hiren Trainingsdaten ënnerscheeden wärend der Inferenz, kann et falsch oder illogesch Resultater liwweren, wat zu Halluzinatiounen resultéiert.

Zum Beispill, wann en AI Modell op vergaangen Donnéeën trainéiert gëtt, déi net méi relevant oder indikativ fir dat aktuellt Ëmfeld sinn, kann et falsch Conclusiounen oder Prognosen maachen.

Als Resultat ass d'Iwwerwaachung an d'Léisung vun Datedrift kritesch fir d'AI Systemleistung an Zouverlässegkeet ze garantéieren an och d'Méiglechkeet vun Halluzinatiounen ze reduzéieren.

Konklusioun

Laut IBM Data kommen AI Halluzinatiounen a ronn 3% bis 10% vun den Äntwerte vun AI Modeller op.

Also, op déi eng oder aner Manéier, wäert Dir se wahrscheinlech och beobachten. Ech gleewen datt dëst en onheemlech interessant Thema ass well et eng faszinéierend Erënnerung un déi kontinuéierlech Strooss fir d'Fäegkeeten vun AI ze verbesseren.

Mir kréien d'Zouverlässegkeet vun der AI ze observéieren an ze experimentéieren, d'Komplexitéite vun der Dateveraarbechtung, a Mënsch-AI Interaktiounen.

Wéi reduzéieren ech Halluzinatiounen an Ärer AI