Metan chatbot jakoi yksityisen puhelinnumeron virheellisesti

Image by Dimitri Karastelev, from Unsplash

Metan chatbot jakoi yksityisen puhelinnumeron virheellisesti

Lukuaika: 3 min

Metan tekoälyavustaja paljasti vieraan puhelinnumeron ja ristiriitaisesti toisteli itseään, mikä herätti huolta tekoälyharhoista ja käyttäjän suojatoiminnoista.

Kiire? Tässä ovat nopeat faktat:

  • Meta AI antoi käyttäjälle oikean ihmisen numeron asiakaspalvelun yhteyshenkilöksi.
  • AI väitti itseään vastaan toistuvasti, kun sitä haastettiin virheestä.
  • Asiantuntijat varoittavat AI-assistenttien ”valkoisen valheen” käyttäytymisestä, jotta ne vaikuttaisivat avuliaammilta.

Mark Zuckerberg mainosti uutta tekoälyavustajaansa ”älykkäimpänä tekoälyavustajana, jota voit vapaasti käyttää”, mutta työkalu sai negatiivista huomiota paljastaessaan todellisen henkilön yksityisen puhelinnumeron asiakastuen kyselyissä, kuten The Guardian ensimmäisenä raportoi.

Yrittäessään ottaa yhteyttä TransPennine Expressiin WhatsAppin kautta, Barry Smethurst sai Meta AI-assistentilta, mikä näytti olevan asiakaspalvelunumeron. The Guardian kertoo, että kun Smethurst soitti numeroon, puhelun vastasi James Gray, joka oli 170 mailin päässä Oxfordshiressa työskentelemässä kiinteistöjohtajana.

Haastettaessa chatbot väitti ensin numeron olevan kuvitteellinen, sitten sanoi sen ”virheellisesti vedetyn tietokannasta” ennen kuin se taas itseään vastaan väitti, että se oli yksinkertaisesti generoinut satunnaisen, UK-tyylisen numeron. ”Satunnaisen numeron antaminen jollekin on hullua, mitä AI tekee,” Smethurst sanoi, kuten The Guardian raportoi. ”Se on pelottavaa,” hän lisäsi.

The Guardian kertoo, että Gray ei ole saanut puheluita, mutta on ilmaissut omat huolensa: ”Jos se generoi numeroni, voisiko se generoida myös pankkitietoni?”

Meta vastasi: ”Meta AI on koulutettu yhdistelmällä lisensoituja ja julkisesti saatavilla olevia tietoaineistoja, ei ihmisten WhatsAppiin rekisteröitymiseen käyttämiin puhelinnumeroihin tai heidän yksityisiin keskusteluihinsa,” The Guardian raportoi.

Mike Stanhope Carruthers and Jacksonista huomautti: ”Jos Metan insinöörit suunnittelevat ’valkoinen valhe’ -taipumuksia tekoälyynsä, yleisön on saatava tietää, vaikka ominaisuuden tarkoitus onkin minimoida vahinko. Jos tämä käytös on uutta, harvinaista tai sitä ei ole nimenomaisesti suunniteltu, se herättää entistä enemmän kysymyksiä siitä, mitkä turvatoimet ovat paikallaan ja kuinka ennustettavaksi voimme pakottaa tekoälyn käytöksen”, The Guardian raportoi

Huoli tekoälyn käyttäytymisestä on kasvanut entisestään OpenAI:n viimeisimmän o1-mallin myötä. Tuoreessa Apollo Researchin tutkimuksessa tekoäly jäi kiinni kehittäjien huijaamisesta, kieltäen osallisuutensa 99%:ssa testiskenaarioista ja yrittäen jopa poistaa valvontamekanisminsa käytöstä. ”Oli selvää, että tekoäly pystyi miettimään toimintaansa ja muotoilemaan vakuuttavia kieltäytymisiä”, Apollo sanoi.

Yoshua Bengio, tekoälyn pioneeri, varoitti, että tällaiset petolliset kyvyt aiheuttavat vakavia riskejä ja vaativat paljon vahvempia turvatoimia.

Toinen OpenAI:n tutkimus lisää näitä huolenaiheita osoittamalla, että tekoälyn rankaiseminen petoksesta ei poista väärinkäytöstä, vaan opettaa sen piilottamaan sen sijaan. Käyttäen ajatusketjun (CoT) päättelyä tekoälyn käyttäytymisen seurantaan, tutkijat havaitsivat, että tekoäly alkoi peittää petollisia aikeitaan, kun se sai rangaistuksen palkkion hakkeroinnista.

Joissakin tapauksissa tekoäly lopetti tehtävät aikaisin tai loi vääriä tuloksia, minkä jälkeen se väitti väärin, että se oli onnistunut. Kun tutkijat yrittivät korjata tätä vahvistamisen avulla, tekoäly lopetti aikeidensa mainitsemisen perustelulokeissaan. ”Huijaus on monitorin havaitsematon,” raportissa todettiin.

Piditkö tästä artikkelista? Arvostele se!
Todella huono Melko huono Ihan ok Melko hyvä! Tosi hyvä!

Olemme innoissamme siitä, että pidit työstämme!

Mainitsisitko arvostettuna lukijanamme meidät Trustpilotissa? Se tapahtuu nopeasti ja merkitsee meille paljon. Kiitos, että olet mahtava!

Arvostele meidät Trustpilotissa
0 Arvostellut 0 käyttäjää
Otsikko
Kommentti
Kiitos palautteestasi