In den Kommentaren lass ich gestern sinngemäß: wen wundert es, alle wissen, dass #LLMs ständig Fehler machen.
-
Quasi passend dazu: das klingt für normale Menschen sicher skurril, aber in der Ausbildung habe ich reichlich (menschliche) Berichte (uA auch von der Polizei) gelesen, die kaum weniger hanebüchene (wiewohl weniger offensichtlich) waren als dieser „Frosch“. Typische Fehler zB: alle Farben, rechts/links, Personen vertauscht, Rechenfehler, Reihenfolgen vertauscht.
@AwetTesfaiesus vielleicht sollten die berichte einfach wichtig genug
sein dass sie irgendwer liest und dann merkt wenn scheiße drinsteht? wenn ich die mit chatbots erstelle (ich weigere mich das intelligenz zu nennen) kann ich sie lieber weglassen -
hmm, und wenn wir jetzt da einen Menschen wie Trump dazu vergleichen?
Menschen fantasieren recht ähnlich und sind recht ähnlich von ihrer eigenen Genialität überzeugt. Wir zerstören wissentlich gerade unseren Planeten, glauben an irgendwelche Götter und das Thema Fakenews oder Vorurteile brauch ich kaum ansprechen. Wäre toll wenn irgendwas unsere Fehler korrigieren würde, dann bräuchten wir nicht mal mehr irgendwelche Parteien wählen.
@TheOneSwit irgendwas? Da krieg ich gleich Kopfschüttelattacken - wie soll etwas, das solche Irrlichter wie Menschen schaffen, das noch fehlergeneigt ist als wir Menschen selbst, je Lösungen für lebenswichtige Probleme zaubern? Magie gilt nicht
Die Trumps dieser Welt, die gab es schon in unserer Geschichte. Auch im Atomwaffen Zeitalter. Wenn wir Solidarität leben mit den anderen, die nicht so sind, dann besiegen wir auch solche Despoten.
@AwetTesfaiesus -
@TheOneSwit irgendwas? Da krieg ich gleich Kopfschüttelattacken - wie soll etwas, das solche Irrlichter wie Menschen schaffen, das noch fehlergeneigt ist als wir Menschen selbst, je Lösungen für lebenswichtige Probleme zaubern? Magie gilt nicht
Die Trumps dieser Welt, die gab es schon in unserer Geschichte. Auch im Atomwaffen Zeitalter. Wenn wir Solidarität leben mit den anderen, die nicht so sind, dann besiegen wir auch solche Despoten.
@AwetTesfaiesusDas irgendwas bezog sich auf die Aussage dass unsere menschlichen Fehler von uns Menschen korrigiert werden würden. Das seh ich weder bei uns Menschen noch bei den LLM die wir nach unserem Vorbild gestalten und für göttlich halten.
Bei LLM und Menschen sehe ich jedoch starke ähnlichkeiten was Informationsverarbeitung betrifft vor allem bei fehlerhaften oder mangelnden Informationen.
Da spinnen wir noch viel mehr Blödsinn als so eine LLM.
-
Quasi passend dazu: das klingt für normale Menschen sicher skurril, aber in der Ausbildung habe ich reichlich (menschliche) Berichte (uA auch von der Polizei) gelesen, die kaum weniger hanebüchene (wiewohl weniger offensichtlich) waren als dieser „Frosch“. Typische Fehler zB: alle Farben, rechts/links, Personen vertauscht, Rechenfehler, Reihenfolgen vertauscht.
@AwetTesfaiesus KI kann keine Validität garantieren, im Gegenteil. Dem Stumpfsinn wird mancherorts Tür und Tor geöffnet!
-
Das irgendwas bezog sich auf die Aussage dass unsere menschlichen Fehler von uns Menschen korrigiert werden würden. Das seh ich weder bei uns Menschen noch bei den LLM die wir nach unserem Vorbild gestalten und für göttlich halten.
Bei LLM und Menschen sehe ich jedoch starke ähnlichkeiten was Informationsverarbeitung betrifft vor allem bei fehlerhaften oder mangelnden Informationen.
Da spinnen wir noch viel mehr Blödsinn als so eine LLM.
@TheOneSwit Let's agree we disagree. Denn wenn du das wirklich glaubst. dann brauchen wir keine Mediziner*innen mehr für Diagnosen. Egal was dir fehlt, frag doch ChatGTP. @AwetTesfaiesus
-
@oldperl ich denke, meine Frage wird missverstanden. Natürlich sollten wir hinterfragen. Ich frage mich aber: hinterfragen wir menschliche Ergebnisse mit demselben Eifer?
@AwetTesfaiesus
Um beim Beispiel VA zu bleiben: Wenn ein fehlerhafter VA vorliegt, kann man den/die entspr. Sachbearbeiter*in auffordern, diesen zu prüfen. V.a. weil es sich häufig um Flüchtigkeits- und Unaufmerksamkeitsfehler handelt, ist mein Vertrauen darin, dass ein Mensch einen Vorgang überprüft und anschließend richtigstellt, deutlich größer als in eine Überprüfung durch LLMs, die dann neu fabulieren.
@oldperl -
@TheOneSwit Let's agree we disagree. Denn wenn du das wirklich glaubst. dann brauchen wir keine Mediziner*innen mehr für Diagnosen. Egal was dir fehlt, frag doch ChatGTP. @AwetTesfaiesus
Ein Mediziner hat sich entsprechend gebildet und seine "Datenbank" entsprechend mit Informationen versorgt um anhand der Informationen zu einer Beurteilung zu kommen die fachlich korrekt sein mag.
Robert F Kennedy glaubt auch sich entsprechend gebildet zu haben, aufgrund seiner fehlethaften Informationen in seiner "Datenbank" kommt er jedoch auf andere Ergebnisse.
Unser "Wissen" ist auch nur die Sumne unserer Erfahrungen.
-
Ein Mediziner hat sich entsprechend gebildet und seine "Datenbank" entsprechend mit Informationen versorgt um anhand der Informationen zu einer Beurteilung zu kommen die fachlich korrekt sein mag.
Robert F Kennedy glaubt auch sich entsprechend gebildet zu haben, aufgrund seiner fehlethaften Informationen in seiner "Datenbank" kommt er jedoch auf andere Ergebnisse.
Unser "Wissen" ist auch nur die Sumne unserer Erfahrungen.
und ich hatte 15 Jahre Schmerztherapie, bin von Arzt zu Arzt geschickt worden mit dutzenden Diagnosen. Nicht alle Ärzte sind automatisch kompetent.
-
Ein Mediziner hat sich entsprechend gebildet und seine "Datenbank" entsprechend mit Informationen versorgt um anhand der Informationen zu einer Beurteilung zu kommen die fachlich korrekt sein mag.
Robert F Kennedy glaubt auch sich entsprechend gebildet zu haben, aufgrund seiner fehlethaften Informationen in seiner "Datenbank" kommt er jedoch auf andere Ergebnisse.
Unser "Wissen" ist auch nur die Sumne unserer Erfahrungen.
@TheOneSwit Und diese Erfahrung zeigt, dass die Robert Kennedys dieser Welt eher sterben als die, die sich auf wissenschaftliche Evidenz verlassen. Wobei wir wieder bei LLMs landen. Da werden Daten selten gewichtet. Die Esoterik und Schwurbelei wiegen ebenso schwer im Input wie die Wissenschaft. @AwetTesfaiesus
-
In den Kommentaren lass ich gestern sinngemäß: wen wundert es, alle wissen, dass #LLMs ständig Fehler machen. @marcuwekling sagte am Montag bei der Lesung Ähnliches.
Dazu:
1️⃣In der juristischen Ausbildung lernst du, dass 50-70% der Verwaltungsakt falsch sind. Default: falsch!
2️⃣Dazu: in meiner Schulzeit waren Atlanten/Karten immer falsch (DDR drin, teils Saarland draußen, Jugoslawien komplett). Ich habe nicht gehört, dass über Schulen ähnlich gesprochen wird, wie über LLMs. #ki"Ich habe nicht gehört, dass über Schulen ähnlich gesprochen wird, wie über LLMs"
- Ich schon, und zwar z.B. hier: https://social.tchncs.de/deck/@pikarl@reporter.social/115592442929731733 was zu xn--berholt-m2a.schule/ führte. -
@AwetTesfaiesus weil wir von Maschinen eben korrekte Antworten erwarten. Was würdest Du zu einem Taschenrechner sagen, der zu Deiner Frage, was ist 1 + 1? mal mit 3, mal mit 1 oder mal mit 2 antwortet.
Und ja, das ist zweierlei Maß, und in vielen Bereichen nicht ok. Doch daran müsstet zu allererst ihr, als MdB arbeiten.
@oldperl
hm, aus meiner Perspektive ist es eben nicht "zweierlei Maß", weil es sich um unterschiedliche Formen der Bearbeitung von Aufträgen handelt. Was Menschen machen, können/machen nur Menschen; Menschen können nicht "künstlich" denken, so wie Algorithmen nicht "menschlich" denken/arbeiten. Es ist eine Folge der (unterstelltermaßen interessengeleiteten) Benennuung
jenes Arbeits-/Forschungs-/Wirtschaftsbereiches rund um LLMs etc. als "Künstliche Intelligenz".
@AwetTesfaiesus -
und ich hatte 15 Jahre Schmerztherapie, bin von Arzt zu Arzt geschickt worden mit dutzenden Diagnosen. Nicht alle Ärzte sind automatisch kompetent.
@TheOneSwit das sage ich doch gar nicht, aber die Fehlerhäufigkeit bei Globuli Verschreibern ist deutlich höher @AwetTesfaiesus
-
In den Kommentaren lass ich gestern sinngemäß: wen wundert es, alle wissen, dass #LLMs ständig Fehler machen. @marcuwekling sagte am Montag bei der Lesung Ähnliches.
Dazu:
1️⃣In der juristischen Ausbildung lernst du, dass 50-70% der Verwaltungsakt falsch sind. Default: falsch!
2️⃣Dazu: in meiner Schulzeit waren Atlanten/Karten immer falsch (DDR drin, teils Saarland draußen, Jugoslawien komplett). Ich habe nicht gehört, dass über Schulen ähnlich gesprochen wird, wie über LLMs. #kiEine Maschine, die mir eine korrekte Information liefern soll, sollte eine niedrigere Fehlerquote haben - ich warte ja gerade die Rechercheleistung, die ich sonst selbst erbringen muss. Gleichzeitig hat Marc-Uwe gestern einen diesbezüglich wichtigen Aspekt angesprochen: Die KI-Texte klingen oft so wahrscheinlich, obwohl sie falsch sind. Sie wecken Vertrauen, das nicht gerechtfertigt ist.
Und wer ist generell bei menschlichen Aussagen weniger skeptisch?
1/x
-
@AwetTesfaiesus
Gymnasium während der 2000er.
Wir hatten nen Diercke Atlas, aber wenig länderspezifisch damit gearbeitet. Eher mit den Klimakarten und den Vegetationszonen etc.
Später hatte ich geography wg. bilingualem Unterricht, dafür gab es kein klassisches Lehrbuch.Ich erinnere mich nur, dass die Erdkunde-Leute irgendwas zu Fruchtfolgen lernen mussten, so als gäbe es noch Kartoffelferien.
An falsche Landkarten erinnere ich mich nicht.
In der Zeit war aber auch nicht so viel Umbruch in lehrplanrelevanten Regionen. Könnte also auch ein "Jahrzehnt"-assoziiertes Problem sein.@Aubrieta
ja, ich gehe auch davon aus, dass die für die Erstellung der Schulmaterialien zuständigen Verlage seit etwa 1989 unentwegt redigieren mussten und dass weder Schulen noch Verlage hinterherkamen, sämtliche Bildungseinrichtungen ständig mit aktuellen/richtigen Ausgaben zu versorgen.
@AwetTesfaiesus @oldperl -
Eine Maschine, die mir eine korrekte Information liefern soll, sollte eine niedrigere Fehlerquote haben - ich warte ja gerade die Rechercheleistung, die ich sonst selbst erbringen muss. Gleichzeitig hat Marc-Uwe gestern einen diesbezüglich wichtigen Aspekt angesprochen: Die KI-Texte klingen oft so wahrscheinlich, obwohl sie falsch sind. Sie wecken Vertrauen, das nicht gerechtfertigt ist.
Und wer ist generell bei menschlichen Aussagen weniger skeptisch?
1/x
Man vertraut zwar einem #Experten in seinem Gebiet mehr, einem #Journalist oder #Richter vielleicht auch. Aber wenn #Dieseldieter mit hocheffiziente Verbrenner erklärt, dann gehe ich in die Debatte.
Kann man übrigens mit der KI nicht wirklich.
Deine beiden Beispiel sind für mich zudem nicht nachvollziehbar:
1. VA können gerichtlich überprüft werden. Die Skepsis gegen die Richtigkeit ist also bereits im System verankert. Woher stammen Deine %-Angaben...
2/x
-
Man vertraut zwar einem #Experten in seinem Gebiet mehr, einem #Journalist oder #Richter vielleicht auch. Aber wenn #Dieseldieter mit hocheffiziente Verbrenner erklärt, dann gehe ich in die Debatte.
Kann man übrigens mit der KI nicht wirklich.
Deine beiden Beispiel sind für mich zudem nicht nachvollziehbar:
1. VA können gerichtlich überprüft werden. Die Skepsis gegen die Richtigkeit ist also bereits im System verankert. Woher stammen Deine %-Angaben...
2/x
@Der_zuversichtliche_Daniel @marcuwekling wie ich bereits schrieb: die Prozentangaben stammen aus der Ausbildung. Viele davon kannst du googeln.
Die Angaben zu den BAMF-bescheiden schöpfe ich aus eigener Anschauung
-
Man vertraut zwar einem #Experten in seinem Gebiet mehr, einem #Journalist oder #Richter vielleicht auch. Aber wenn #Dieseldieter mit hocheffiziente Verbrenner erklärt, dann gehe ich in die Debatte.
Kann man übrigens mit der KI nicht wirklich.
Deine beiden Beispiel sind für mich zudem nicht nachvollziehbar:
1. VA können gerichtlich überprüft werden. Die Skepsis gegen die Richtigkeit ist also bereits im System verankert. Woher stammen Deine %-Angaben...
2/x
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
-
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
@Der_zuversichtliche_Daniel @marcuwekling das Gebiet der DDR wurde extra nicht als Ausland markiert. Die DDR saß mit der Bundesrepublik zur gleichen Zeit in der UN Vollversammlung.
-
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
Ergebnisse auswirft.
Zuletzt noch eine Frage dazu, welche Schlussfolgerung Du aus dem Vergleich ziehst:
Für mich ist klar, dass Automatisierung nur dann Sinn ergibt, wenn dadurch die Fehlerzahl sinkt. Das scheint mir aber gerade nicht der Fall. Vielmehr sinkt nur die Überprüf- und Feststellbarkeit. Dann doch lieber falsche, aber nachvollziehbare menschliche Entscheidungen, oder?
Dann können die RA, die vor allem streiten um Geld zu verdienen, durch...
4/x
-
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
@Der_zuversichtliche_Daniel @marcuwekling mir ist nicht klar, was du mit falsch positiven bescheiden meinst. Hartz IV, dass gewährt wird, obwohl die Voraussetzung nicht vorliegen?