Anzeige
Anzeige
MIT Technology Review News

KI-Agent gewinnt Ideenwettbewerb: Menschliche Experten müssen sich geschlagen geben

Ein Forschungsteam der Stanford University hat einen KI-Agenten programmiert, der bessere und innovativere Ideen für zukünftige Forschungsprojekte erzeugt als menschliche Expert:innen auf diesem Gebiet.

Von Wolfgang Stieler
2 Min.
Artikel merken
Anzeige
Anzeige

Eine Forscher-KI gibt es bereits, doch wie gut die Ideen tatsächlich sind, hat jetzt eine Studie untersucht. (Foto: PeopleImages.com – Yuri A /Shutterstock)

Dass KI-Agenten grundsätzlich selbstständig forschen können, ist längst keine Science-Fiction mehr. Das japanische Unternehmen Sakina AI veröffentlichte beispielsweise kürzlich eine KI, die angeblich eigenständig Experimente entwirft, um Hypothesen zu überprüfen, die Ergebnisse auswertet und daraus dann neue Vorschläge für weitere Forschung erzeugt. Allerdings gab es bisher noch keine systematische Untersuchung darüber, was die von den KIs erzeugten Ideen wirklich taugen. Chenglei Si, Diyi Yang und Tatsunori Hashimoto haben dazu jetzt eine umfangreiche Studie als Preprint Paper veröffentlicht.

Anzeige
Anzeige

Ideenwettbewerb: Mensch gegen Maschine

Sie rekrutierten 49 menschliche KI-Expert:innen, um Vorschläge für Forschungsvorhaben im Bereich der maschinellen Sprachverarbeitung (NLP) zu schreiben. Diese hatten zehn Tage Zeit, um ihre Vorschläge zu formulieren – für jeden eingereichten Vorschlag erhielten sie 300 US-Dollar. Zudem war eine Prämie von je 1000 Dollar für die fünf von den Gutachtern am höchsten bewerteten Ideen ausgeschrieben.

Außerdem engagierten die Forschenden 79 menschliche Expert:innen die eine Woche Zeit hatten, um bis zu sieben eingereichte Vorschläge zu bewerten. Dabei wussten die Gutachter:innen nicht, ob sie einen menschlichen oder einen KI-generierten Text bewerteten.

Anzeige
Anzeige

Worin die KI-Konzepte besser waren

Insgesamt schnitten die von der KI-generierten Konzepte etwas besser ab. Insbesondere wurden sie als „spannender“ als die von Menschen verfassten bewertet. Menschen, schreiben die Autor:innen in ihrem Paper, würden sich mehr auf aktuelle und wohlbekannte Probleme konzentrieren und hätten mehr die Durchführbarkeit ihrer Projekte im Kopf. Dementsprechend waren bei den KI-Vorschlägen auch die Bewertungen für die Durchführbarkeit schlechter als bei den Menschen.

Wie funktioniert ein KI-Ideengenerator?

Die KI, die sich so gut geschlagen hat, beruht im Wesentlichen auf dem großen Sprachmodell Claude 3.5 von Anthropic, das mit anderen Softwaremodulen zusammengeschaltet wurde. So erhielt der KI-Agent beispielsweise die Fähigkeit, mithilfe des Online-Dienstes Semantic Scholar schon veröffentlichte Artikel zu einem vorgegebenen Forschungsthema zu finden. Basierend auf den besten Ergebnissen dieser Papersuche formulierte das große Sprachmodell dann 4.000 offene, weitergehende Forschungsfragen zu dem Thema. Ein Bewertungsmodul fischte aus diesen 4.000 Vorschlägen dann jeweils die besten Ideen. Ein interessantes Ergebnis dieser Arbeit ist jedoch, dass die Zahl 4.000 offenbar viel zu hoch gegriffen war. In der Regel waren von den 4.000 Ideen nur rund 200 wirklich brauchbar.

Anzeige
Anzeige

Nächster Schritt: Ideen für KI-Tagung

Si und seine Kolleg:innen ließen ihren KI-Agenten auch Ideen für eine KI-Tagung erzeugen, die sie im Herbst mit den tatsächlich als am besten bewerteten Beiträgen dieser Tagung vergleichen wollen. Im nächsten Schritt überlegen sie auch, ihre KI Code schreiben zu lassen, um die vorgeschlagenen Hypothesen auch testen zu können. Ob sich die Methode auch auf andere Disziplinen außerhalb der KI-Forschung übertragen lässt, ist allerdings eine spannende Frage. Denn auch innerhalb der engen, fachspezifischen Grenzen konnte die KI zwar mitunter spannende Fragen aufwerfen. Vom Sinn und Mehrwert dieser Projekte waren die menschlichen Gutachter:innen aber des Öfteren nicht wirklich überzeugt.

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige