In den Kommentaren lass ich gestern sinngemäß: wen wundert es, alle wissen, dass #LLMs ständig Fehler machen.
-
Man vertraut zwar einem #Experten in seinem Gebiet mehr, einem #Journalist oder #Richter vielleicht auch. Aber wenn #Dieseldieter mit hocheffiziente Verbrenner erklärt, dann gehe ich in die Debatte.
Kann man übrigens mit der KI nicht wirklich.
Deine beiden Beispiel sind für mich zudem nicht nachvollziehbar:
1. VA können gerichtlich überprüft werden. Die Skepsis gegen die Richtigkeit ist also bereits im System verankert. Woher stammen Deine %-Angaben...
2/x
@Der_zuversichtliche_Daniel @marcuwekling wie ich bereits schrieb: die Prozentangaben stammen aus der Ausbildung. Viele davon kannst du googeln.
Die Angaben zu den BAMF-bescheiden schöpfe ich aus eigener Anschauung
-
Man vertraut zwar einem #Experten in seinem Gebiet mehr, einem #Journalist oder #Richter vielleicht auch. Aber wenn #Dieseldieter mit hocheffiziente Verbrenner erklärt, dann gehe ich in die Debatte.
Kann man übrigens mit der KI nicht wirklich.
Deine beiden Beispiel sind für mich zudem nicht nachvollziehbar:
1. VA können gerichtlich überprüft werden. Die Skepsis gegen die Richtigkeit ist also bereits im System verankert. Woher stammen Deine %-Angaben...
2/x
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
-
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
@Der_zuversichtliche_Daniel @marcuwekling das Gebiet der DDR wurde extra nicht als Ausland markiert. Die DDR saß mit der Bundesrepublik zur gleichen Zeit in der UN Vollversammlung.
-
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
Ergebnisse auswirft.
Zuletzt noch eine Frage dazu, welche Schlussfolgerung Du aus dem Vergleich ziehst:
Für mich ist klar, dass Automatisierung nur dann Sinn ergibt, wenn dadurch die Fehlerzahl sinkt. Das scheint mir aber gerade nicht der Fall. Vielmehr sinkt nur die Überprüf- und Feststellbarkeit. Dann doch lieber falsche, aber nachvollziehbare menschliche Entscheidungen, oder?
Dann können die RA, die vor allem streiten um Geld zu verdienen, durch...
4/x
-
eigentlich? Und wieso nennst Du eine so große Spanne? Und ist darin berücksichtigt, dass nicht jeder Fehler sich im Ergebnis auswirkt und was ist mit falsch positiven Bescheiden, sind die gleich schlimm wie negative?
2. Falsche Atlanten basieren in der Regel vermutlich eher auf Überalterung und nicht auf einem menschlichen Fehler bei der Erstellung. Das ist also gar nicht vergleichbar mit dem Problem, dass eine KI, die vorgibt aktuell zu sein, falsche...
3/x
@Der_zuversichtliche_Daniel @marcuwekling mir ist nicht klar, was du mit falsch positiven bescheiden meinst. Hartz IV, dass gewährt wird, obwohl die Voraussetzung nicht vorliegen?
-
hm, was meint denn "nachbilden"? Letztlich ist eine Rechen-/und Rechner-Leistung immer ("nur") eine Rechenleistung und schlicht etwas anderes als die Leistung eines menchlichen Gehirns. Die Verarbeitungsprozesse eines Körpers mit entsprechenden Schnittstellen zur Umwelt können nicht "nachgebildet" werden. Man sollte aufhören, diese schrägen Narrative von sog. Künstlicher "Intelligenz" usw. mitzutragen.
-
@TheOneSwit das sage ich doch gar nicht, aber die Fehlerhäufigkeit bei Globuli Verschreibern ist deutlich höher @AwetTesfaiesus
Ja, und da stimme ich dir zu was die Erwartung an LLM's betrifft. Wie können wir perfektion von künstlicher Intelligenz erwarten wenn unsere reale Intelligenz schon so mangelhaft ist.
Wie können wir auf erfolg hoffen wenn ein Elon Musk seine LLM schon so programmiert dass sie seine Wahrheiten verbreiten soll und seine großartigkeit preisen.
Einzigen Vorteil einer LLM seh ich im fehlen von Emotionen. Mit den richtigen Daten als Input erhält man nüchterne Antwort
-
Ergebnisse auswirft.
Zuletzt noch eine Frage dazu, welche Schlussfolgerung Du aus dem Vergleich ziehst:
Für mich ist klar, dass Automatisierung nur dann Sinn ergibt, wenn dadurch die Fehlerzahl sinkt. Das scheint mir aber gerade nicht der Fall. Vielmehr sinkt nur die Überprüf- und Feststellbarkeit. Dann doch lieber falsche, aber nachvollziehbare menschliche Entscheidungen, oder?
Dann können die RA, die vor allem streiten um Geld zu verdienen, durch...
4/x
Gerichte korrigiert werden, ebenso wie Behörden, die von Herrn #Dobrindt geleitet werden
und Rechtsanwälte können "gottgleiche" Richter von höheren Instanzen überprüfen lassen.Ähnlich in der Wissenschaft, wo Fachartikel eben von Fachkollegen überprüft werden usw.
5/x
-
Konkret: Ich könnte mir vorstellen, dass in dieser (!) konkreten Herangehensweisen an KI viel Coping steckt. Lügen wir uns hier kollektiv in die eigene (intellektuelle) Tasche?
Oder pfeifen wir hier sogar schon verzweifelt im Walde?
Liege ich komplett falsch?
@AwetTesfaiesus Interessante Frage. Ich habe einige der Diskussionsthreads quer gelesen. Ich habe keinerlei juristische Erfahrung. Hier meine 2c.

Der eigentliche Skandal deiner Aussagen liegt IMHO in der hohen Anzahl der menschlichen Fehler. Wobei politisch motivierte rechtliche Fehler da nicht eingerechnet werden sollten - wir haben verschiedene Ebenen von Fehlern.
1/x
-
@Der_zuversichtliche_Daniel @marcuwekling wie ich bereits schrieb: die Prozentangaben stammen aus der Ausbildung. Viele davon kannst du googeln.
Die Angaben zu den BAMF-bescheiden schöpfe ich aus eigener Anschauung
Ich habe die gleiche Ausbildung genossen, solche Zahlen wurden mir nie genannt
Vor allem aber muss es da ja einen Maßstab geben. Meinst Du weltweit, deutschlandweit, Steuerbescheide, Hartz IV-Bescheide, Asyl-Bescheide, Baugenehmigungen usw.?
Du siehst ich bin an dieser Stelle skeptisch mit Dir und das obwohl Du bei mir anhand vieler Deiner sonstigen Posts durchaus Vertrauen genießt.
-
Ja, und da stimme ich dir zu was die Erwartung an LLM's betrifft. Wie können wir perfektion von künstlicher Intelligenz erwarten wenn unsere reale Intelligenz schon so mangelhaft ist.
Wie können wir auf erfolg hoffen wenn ein Elon Musk seine LLM schon so programmiert dass sie seine Wahrheiten verbreiten soll und seine großartigkeit preisen.
Einzigen Vorteil einer LLM seh ich im fehlen von Emotionen. Mit den richtigen Daten als Input erhält man nüchterne Antwort
@TheOneSwit mag sein, aber zum heutigen Stand erhältst du keine logische Antwort. Du erhältst das Ergebnis, das laut vorhandener Datenlage das häufigste und deshalb das wahrscheinlichste ist. Und das dann auch noch mit einem Datenhaufen, in dem wissenschaftliche Erkenntnisse, die auf Evidenz basieren gleich gewichtet werden mit Hokuspokus und Schwurbelei. Da verzichte ich dann lieber auf diesen #AISlop @AwetTesfaiesus
-
@TheOneSwit Und diese Erfahrung zeigt, dass die Robert Kennedys dieser Welt eher sterben als die, die sich auf wissenschaftliche Evidenz verlassen. Wobei wir wieder bei LLMs landen. Da werden Daten selten gewichtet. Die Esoterik und Schwurbelei wiegen ebenso schwer im Input wie die Wissenschaft. @AwetTesfaiesus
Ja, das "Werkzeug" ist fehlerhaft programmiert und soll aus kapitalistischen/politischen Gründen auch gar nicht richtig funktionieren.
Wäre ja schrecklich wenn so ein Ding nicht bestätigt was Trump, Chamenei, Putin oder auch nur ein Söder sagt. Es würde ja unser Ego verletzen wenn so ein Ding eher recht hätte als ein Mensch.
-
@AwetTesfaiesus Interessante Frage. Ich habe einige der Diskussionsthreads quer gelesen. Ich habe keinerlei juristische Erfahrung. Hier meine 2c.

Der eigentliche Skandal deiner Aussagen liegt IMHO in der hohen Anzahl der menschlichen Fehler. Wobei politisch motivierte rechtliche Fehler da nicht eingerechnet werden sollten - wir haben verschiedene Ebenen von Fehlern.
1/x
@AwetTesfaiesus
Das was du über Juristische Fehler schreibst, hört sich für mich nach einem Skandal an und gebe ich dir Recht: Das sollten wir mindestens so scharf kritisieren und versuchen, zu verbessern. Böse gesprochen (aus Laiensicht): Ist sich die juristische Zunft hier menschlich nicht selbst mehr Wert? Fehler passieren, aber Bullshittexte als quasi Standard der Juristerei - das ist ein gefährliches strukturelles Problem.2/x
-
@Der_zuversichtliche_Daniel @marcuwekling das Gebiet der DDR wurde extra nicht als Ausland markiert. Die DDR saß mit der Bundesrepublik zur gleichen Zeit in der UN Vollversammlung.
Das war nicht in allen Atlanten so und selbst nach Deinem Beispiel ein Spezialfall, der politisch gesteuert war, weil man dadurch die Teilung Deutschlands nicht "anerkennen" wollte.
-
@Der_zuversichtliche_Daniel @marcuwekling mir ist nicht klar, was du mit falsch positiven bescheiden meinst. Hartz IV, dass gewährt wird, obwohl die Voraussetzung nicht vorliegen?
genau
-
@AwetTesfaiesus
Das was du über Juristische Fehler schreibst, hört sich für mich nach einem Skandal an und gebe ich dir Recht: Das sollten wir mindestens so scharf kritisieren und versuchen, zu verbessern. Böse gesprochen (aus Laiensicht): Ist sich die juristische Zunft hier menschlich nicht selbst mehr Wert? Fehler passieren, aber Bullshittexte als quasi Standard der Juristerei - das ist ein gefährliches strukturelles Problem.2/x
@AwetTesfaiesus Zurück zu den LLM.
Die grundlegende Ablehnung sehe ich nicht. Hier ist das Fediverse eine Blase. Dass KI nicht so viel wie erwartet genutzt wird, liegt an einer Überschätzung des Bedarfs gegenüber Investierenden. Und daran, dass wir (in DE) sehr viel weniger weit in der Digitalisierung der Bevölkerung sind, als wir glauben.
3/x
-
@AwetTesfaiesus Zurück zu den LLM.
Die grundlegende Ablehnung sehe ich nicht. Hier ist das Fediverse eine Blase. Dass KI nicht so viel wie erwartet genutzt wird, liegt an einer Überschätzung des Bedarfs gegenüber Investierenden. Und daran, dass wir (in DE) sehr viel weniger weit in der Digitalisierung der Bevölkerung sind, als wir glauben.
3/x
@AwetTesfaiesus In den Diskussionen wird von einer neutralen LLM ausgegangen. Die Machtverhältnisse und Beeinflussung sind aber entscheidender Bestandteil der Diskussion oder sollten es sein. Man schaue sich nur die bekannt gewordenen Fälle ein wie zum Beispiel bei Grok. Die diskutierten Fälle der "absichtlichen Fehler zur Erreichung politischer Ziele" werden mit LLM skaliert und (noch) weniger nachvollziehbar.
4/x
-
@AwetTesfaiesus In den Diskussionen wird von einer neutralen LLM ausgegangen. Die Machtverhältnisse und Beeinflussung sind aber entscheidender Bestandteil der Diskussion oder sollten es sein. Man schaue sich nur die bekannt gewordenen Fälle ein wie zum Beispiel bei Grok. Die diskutierten Fälle der "absichtlichen Fehler zur Erreichung politischer Ziele" werden mit LLM skaliert und (noch) weniger nachvollziehbar.
4/x
@AwetTesfaiesus Daher ist eine kritische Betrachtung der Eingaben und Ausgaben der Maschine absolut elementar, muss ständig passieren und wird nie enden. So wie Sicherheitstests, TüV und so weiter beim KFZ. Und trotzdem schlüpfen Fehler durch und verursachen Unfälle.
5/6
-
Ergebnisse auswirft.
Zuletzt noch eine Frage dazu, welche Schlussfolgerung Du aus dem Vergleich ziehst:
Für mich ist klar, dass Automatisierung nur dann Sinn ergibt, wenn dadurch die Fehlerzahl sinkt. Das scheint mir aber gerade nicht der Fall. Vielmehr sinkt nur die Überprüf- und Feststellbarkeit. Dann doch lieber falsche, aber nachvollziehbare menschliche Entscheidungen, oder?
Dann können die RA, die vor allem streiten um Geld zu verdienen, durch...
4/x
@Der_zuversichtliche_Daniel @marcuwekling das ist eben der springende Punkt! Aber jedenfalls ist auch Schnelligkeit ein Problem! Bei deutschen Gerichten liege 1 Mio Verfahren unerledigt
-
@AwetTesfaiesus Daher ist eine kritische Betrachtung der Eingaben und Ausgaben der Maschine absolut elementar, muss ständig passieren und wird nie enden. So wie Sicherheitstests, TüV und so weiter beim KFZ. Und trotzdem schlüpfen Fehler durch und verursachen Unfälle.
5/6
Mal bis hierher zusammengefasst, IMHO:
- Die Juristerei (hier als Beispiel, also nicht nur diese) muss ihren eigenen Anspruch wieder erhöhen, und wir alle sollten da lauter und mehr kritisieren. (Es ist halt nicht einfach für uns Laien)- LLMs skalieren Probleme, die wir ohne diese schon massiv haben. Aber was lösen sie wirklich? Wer profitiert davon? Und wer hat die Macht?
(Danke für das Aufmachen der interessanten Diskussion:) ).