Mastodon Skip to content
  • Home
  • Aktuell
  • Tags
  • Über dieses Forum
Einklappen
Grafik mit zwei überlappenden Sprechblasen, eine grün und eine lila.
Abspeckgeflüster – Forum für Menschen mit Gewicht(ung)

Kostenlos. Werbefrei. Menschlich. Dein Abnehmforum.

  1. Home
  2. Uncategorized
  3. Sehr schöner ChatGPT Takedown an einem sehr simplen aber extrem lustigen Beispiel https://mindmatters.ai/2025/08/chatgpt-5-tries-out-rotated-tic-tac-toe-you-be-the-judge/

Sehr schöner ChatGPT Takedown an einem sehr simplen aber extrem lustigen Beispiel https://mindmatters.ai/2025/08/chatgpt-5-tries-out-rotated-tic-tac-toe-you-be-the-judge/

Geplant Angeheftet Gesperrt Verschoben Uncategorized
36 Beiträge 5 Kommentatoren 0 Aufrufe
  • Älteste zuerst
  • Neuste zuerst
  • Meiste Stimmen
Antworten
  • In einem neuen Thema antworten
Anmelden zum Antworten
Dieses Thema wurde gelöscht. Nur Nutzer mit entsprechenden Rechten können es sehen.
  • lbenedix@chaos.socialL lbenedix@chaos.social

    @343max Das Schöne ist ja, dass es Forschung gibt und die ist bisher ziemlich eindeutig. Man fühlt sich als Softwareentwickler mit LLM-"Unterstützung " deutlich produktiver als man tatsächlich ist.

    https://metr.org/

    rstockm@chaos.socialR This user is from outside of this forum
    rstockm@chaos.socialR This user is from outside of this forum
    rstockm@chaos.social
    schrieb zuletzt editiert von
    #22

    @lbenedix @343max Sehr schöne Seite, danke dafür. Direkt eine Studie darüber aber so:

    lbenedix@chaos.socialL 1 Antwort Letzte Antwort
    0
    • rstockm@chaos.socialR rstockm@chaos.social

      @lbenedix @343max Sehr schöne Seite, danke dafür. Direkt eine Studie darüber aber so:

      lbenedix@chaos.socialL This user is from outside of this forum
      lbenedix@chaos.socialL This user is from outside of this forum
      lbenedix@chaos.social
      schrieb zuletzt editiert von
      #23

      @rstockm @343max Vorhersagen darüber, was in 10 Jahren ist, sind in der AI Welt bestimmt zuverlässig.

      rstockm@chaos.socialR 1 Antwort Letzte Antwort
      0
      • lbenedix@chaos.socialL lbenedix@chaos.social

        @rstockm @343max Vorhersagen darüber, was in 10 Jahren ist, sind in der AI Welt bestimmt zuverlässig.

        rstockm@chaos.socialR This user is from outside of this forum
        rstockm@chaos.socialR This user is from outside of this forum
        rstockm@chaos.social
        schrieb zuletzt editiert von
        #24

        @lbenedix @343max Genau darum extra poliert diese Studie ja den Trend der letzten zehn Jahre. Aber klar, aus einem uns leider noch nicht bekannten Grund ist genau jetzt der Zeitpunkt erreicht, wo dieses exponentielle Wachstum schlagartig stoppen wird.

        lbenedix@chaos.socialL 1 Antwort Letzte Antwort
        0
        • rstockm@chaos.socialR rstockm@chaos.social

          @lbenedix @343max Genau darum extra poliert diese Studie ja den Trend der letzten zehn Jahre. Aber klar, aus einem uns leider noch nicht bekannten Grund ist genau jetzt der Zeitpunkt erreicht, wo dieses exponentielle Wachstum schlagartig stoppen wird.

          lbenedix@chaos.socialL This user is from outside of this forum
          lbenedix@chaos.socialL This user is from outside of this forum
          lbenedix@chaos.social
          schrieb zuletzt editiert von
          #25

          @rstockm @343max 2020 ist nicht ganz 10 Jahre her. Und ja, ich habe das Gefühl, dass es in den letzten 1-2 Jahren eher eine Stagnation gibt

          rstockm@chaos.socialR 1 Antwort Letzte Antwort
          0
          • lbenedix@chaos.socialL lbenedix@chaos.social

            @rstockm @343max 2020 ist nicht ganz 10 Jahre her. Und ja, ich habe das Gefühl, dass es in den letzten 1-2 Jahren eher eine Stagnation gibt

            rstockm@chaos.socialR This user is from outside of this forum
            rstockm@chaos.socialR This user is from outside of this forum
            rstockm@chaos.social
            schrieb zuletzt editiert von
            #26

            @lbenedix @343max Also zumindest um den nächsten Datenpunkt mache ich mir keine Sorgen – Claude Sonet 4.5 ist dramatisch besser als hier das letzte 3.7

            lbenedix@chaos.socialL 1 Antwort Letzte Antwort
            0
            • rstockm@chaos.socialR rstockm@chaos.social

              @lbenedix @343max Also zumindest um den nächsten Datenpunkt mache ich mir keine Sorgen – Claude Sonet 4.5 ist dramatisch besser als hier das letzte 3.7

              lbenedix@chaos.socialL This user is from outside of this forum
              lbenedix@chaos.socialL This user is from outside of this forum
              lbenedix@chaos.social
              schrieb zuletzt editiert von
              #27

              @rstockm @343max Bisher hat mich noch kein LLM für die Softwareentwicklung überzeugt. Ja, die kotzen schnell einen Prototypen raus, aber sobald die echte Welt damit in Verbindung kommt, explodiert alles.

              Für kleine Nischenprobleme kann es vielleicht was taugen, aber da sind spezielle Lösungen sicher besser als LLMs.

              rstockm@chaos.socialR 1 Antwort Letzte Antwort
              0
              • lbenedix@chaos.socialL lbenedix@chaos.social

                @rstockm @343max Bisher hat mich noch kein LLM für die Softwareentwicklung überzeugt. Ja, die kotzen schnell einen Prototypen raus, aber sobald die echte Welt damit in Verbindung kommt, explodiert alles.

                Für kleine Nischenprobleme kann es vielleicht was taugen, aber da sind spezielle Lösungen sicher besser als LLMs.

                rstockm@chaos.socialR This user is from outside of this forum
                rstockm@chaos.socialR This user is from outside of this forum
                rstockm@chaos.social
                schrieb zuletzt editiert von
                #28

                @lbenedix @343max Tja, so unterschiedlich sind die Einschätzung. Ich habe in 2025 sechs Projekte publiziert, keines von denen hätte ich ohne LLM auch nur begonnen.

                lbenedix@chaos.socialL 1 Antwort Letzte Antwort
                0
                • rstockm@chaos.socialR rstockm@chaos.social

                  @lbenedix @343max Tja, so unterschiedlich sind die Einschätzung. Ich habe in 2025 sechs Projekte publiziert, keines von denen hätte ich ohne LLM auch nur begonnen.

                  lbenedix@chaos.socialL This user is from outside of this forum
                  lbenedix@chaos.socialL This user is from outside of this forum
                  lbenedix@chaos.social
                  schrieb zuletzt editiert von
                  #29

                  @rstockm @343max Kommt sicher immer auf die Komplexität des Projektes an. Kannst du die Projekte verlinken?

                  rstockm@chaos.socialR 1 Antwort Letzte Antwort
                  0
                  • lbenedix@chaos.socialL lbenedix@chaos.social

                    @rstockm @343max Kommt sicher immer auf die Komplexität des Projektes an. Kannst du die Projekte verlinken?

                    rstockm@chaos.socialR This user is from outside of this forum
                    rstockm@chaos.socialR This user is from outside of this forum
                    rstockm@chaos.social
                    schrieb zuletzt editiert von
                    #30

                    @lbenedix @343max Alles hier aus den letzten 2 Jahren dazu zwei nicht öffentliche die noch komplexer sind:

                    https://github.com/rstockm?tab=repositories

                    Es kommt halt auch darauf an ob man die LLMs beim Coden als Gegner sieht den man aufs Kreuz legen möchte oder als endlos geduldig motivierten Junior DEV den man ins eigene Projekt einarbeitet.

                    343max@mastodon.social3 1 Antwort Letzte Antwort
                    0
                    • rstockm@chaos.socialR rstockm@chaos.social

                      @lbenedix @343max Alles hier aus den letzten 2 Jahren dazu zwei nicht öffentliche die noch komplexer sind:

                      https://github.com/rstockm?tab=repositories

                      Es kommt halt auch darauf an ob man die LLMs beim Coden als Gegner sieht den man aufs Kreuz legen möchte oder als endlos geduldig motivierten Junior DEV den man ins eigene Projekt einarbeitet.

                      343max@mastodon.social3 This user is from outside of this forum
                      343max@mastodon.social3 This user is from outside of this forum
                      343max@mastodon.social
                      schrieb zuletzt editiert von
                      #31

                      @rstockm @lbenedix Ein junior Dev den man ins eigene Projekt einarbeitet lernt dazu, eine LLM nicht. Wo ist denn in diesen ganzen Projekten mal ein gutes dabei, wo du ein größeres Feature geoneshottet hast? Hast du ein Beispiel für einen Prompt, der mir ein größeres Feature baut?

                      lbenedix@chaos.socialL 1 Antwort Letzte Antwort
                      0
                      • 343max@mastodon.social3 343max@mastodon.social

                        @rstockm @lbenedix Ein junior Dev den man ins eigene Projekt einarbeitet lernt dazu, eine LLM nicht. Wo ist denn in diesen ganzen Projekten mal ein gutes dabei, wo du ein größeres Feature geoneshottet hast? Hast du ein Beispiel für einen Prompt, der mir ein größeres Feature baut?

                        lbenedix@chaos.socialL This user is from outside of this forum
                        lbenedix@chaos.socialL This user is from outside of this forum
                        lbenedix@chaos.social
                        schrieb zuletzt editiert von
                        #32

                        @343max @rstockm Bei der Beurteilung, ob ein LLM gute Arbeit macht, spielen viele psychologische Verzerrungen mit. Es fängt schon damit an, dass man selbst etwas tut, also einen Prompt formuliert und dann passiert etwas. Das ist natürlich toll.

                        Aber ja, es gibt glaub ich kein erfolgreiches Open Source Projekt, bei dem der überwiegende Anteil der Contributions von LLMs kommt. Oder?

                        rstockm@chaos.socialR 1 Antwort Letzte Antwort
                        0
                        • lbenedix@chaos.socialL lbenedix@chaos.social

                          @343max @rstockm Bei der Beurteilung, ob ein LLM gute Arbeit macht, spielen viele psychologische Verzerrungen mit. Es fängt schon damit an, dass man selbst etwas tut, also einen Prompt formuliert und dann passiert etwas. Das ist natürlich toll.

                          Aber ja, es gibt glaub ich kein erfolgreiches Open Source Projekt, bei dem der überwiegende Anteil der Contributions von LLMs kommt. Oder?

                          rstockm@chaos.socialR This user is from outside of this forum
                          rstockm@chaos.socialR This user is from outside of this forum
                          rstockm@chaos.social
                          schrieb zuletzt editiert von
                          #33

                          @lbenedix @343max Schön, dass ihr euch einig seid, dass meine Apps alle unterkomplex sind. Was ich sagen kann:
                          1) ich habe keine Zeile davon selbst geschrieben
                          2) keines der Projekte hätte ich angefangen ohne LLMs (ich kann kein JavaScript)
                          3) die Oneshot Quote ist mit den Monaten kontinuierlich gestiegen, bei Testabend fast alles bis auf mobil CSS
                          4) Einigen der Tools würde ich doch gesellschaftlichen Nutzen zuschreiben wie Mastowall, Mastotags oder Fedipol.

                          jaddy@friend.enby-box.deJ 1 Antwort Letzte Antwort
                          0
                          • rstockm@chaos.socialR rstockm@chaos.social

                            @lbenedix @343max Schön, dass ihr euch einig seid, dass meine Apps alle unterkomplex sind. Was ich sagen kann:
                            1) ich habe keine Zeile davon selbst geschrieben
                            2) keines der Projekte hätte ich angefangen ohne LLMs (ich kann kein JavaScript)
                            3) die Oneshot Quote ist mit den Monaten kontinuierlich gestiegen, bei Testabend fast alles bis auf mobil CSS
                            4) Einigen der Tools würde ich doch gesellschaftlichen Nutzen zuschreiben wie Mastowall, Mastotags oder Fedipol.

                            jaddy@friend.enby-box.deJ This user is from outside of this forum
                            jaddy@friend.enby-box.deJ This user is from outside of this forum
                            jaddy@friend.enby-box.de
                            schrieb zuletzt editiert von
                            #34

                            @rstockm Geht mir genauso. Ich brauchte zB Backup-Apps für ein phpBB Forum und meine Friendica-Instanz. Ersteres hab ich vor Jahren schon mal selbst gemacht. War ein Mega-Gefummel und ich hab nichts sinnvolles dabei gelernt.

                            Mit Claude ging das nicht nur schneller, sondern ich habe auch reichlich gelernt, wie Dinge mit Python gehen können, ohne mich erst durch hunderte Packages zu wühlen, oder in CSS, wo ich so überhaupt keine Ahnung habe. (Die Backup-Apps können static web sites mit den Inhalten erzeugen)

                            Ich habe aber reichlich Erfahrung in Specs schreiben, Leute anleiten und deren Zeugs testen und debuggen. Job-mässig bin ich eher in C/C++ für Produktionssteuerungen unterwegs. Von embedded bis SAP-Anschluss.

                            Ich mag die Geschwindigkeit, wenn ich mit Coding LLMs werkel. Es lassen sich Dinge ausprobieren, wo ich Stunden für's (um)schreiben gebraucht hätte. Ich kann viel schneller Packages und Libs finden und anwenden (lassen) in Bereichen, wo ich mich bisher nicht auskenne. Beim Friendica-Backup zB die Authentification, die vier web-APIs, usw. Ich die meiste Zeit auf der funktionalen Ebene, nicht mit einzelnen Fizzeligkeiten beschäftigt. Claude kann inzwischen auch ziemlich gute Doku und Kommentare schreiben, so dass ich mich auch in Code unbekannter Sprachen schnell zurecht finden kann, wenn ich mal genauer schauen möchte.

                            jwalzer@infosec.exchangeJ 1 Antwort Letzte Antwort
                            0
                            • jaddy@friend.enby-box.deJ jaddy@friend.enby-box.de

                              @rstockm Geht mir genauso. Ich brauchte zB Backup-Apps für ein phpBB Forum und meine Friendica-Instanz. Ersteres hab ich vor Jahren schon mal selbst gemacht. War ein Mega-Gefummel und ich hab nichts sinnvolles dabei gelernt.

                              Mit Claude ging das nicht nur schneller, sondern ich habe auch reichlich gelernt, wie Dinge mit Python gehen können, ohne mich erst durch hunderte Packages zu wühlen, oder in CSS, wo ich so überhaupt keine Ahnung habe. (Die Backup-Apps können static web sites mit den Inhalten erzeugen)

                              Ich habe aber reichlich Erfahrung in Specs schreiben, Leute anleiten und deren Zeugs testen und debuggen. Job-mässig bin ich eher in C/C++ für Produktionssteuerungen unterwegs. Von embedded bis SAP-Anschluss.

                              Ich mag die Geschwindigkeit, wenn ich mit Coding LLMs werkel. Es lassen sich Dinge ausprobieren, wo ich Stunden für's (um)schreiben gebraucht hätte. Ich kann viel schneller Packages und Libs finden und anwenden (lassen) in Bereichen, wo ich mich bisher nicht auskenne. Beim Friendica-Backup zB die Authentification, die vier web-APIs, usw. Ich die meiste Zeit auf der funktionalen Ebene, nicht mit einzelnen Fizzeligkeiten beschäftigt. Claude kann inzwischen auch ziemlich gute Doku und Kommentare schreiben, so dass ich mich auch in Code unbekannter Sprachen schnell zurecht finden kann, wenn ich mal genauer schauen möchte.

                              jwalzer@infosec.exchangeJ This user is from outside of this forum
                              jwalzer@infosec.exchangeJ This user is from outside of this forum
                              jwalzer@infosec.exchange
                              schrieb zuletzt editiert von
                              #35

                              @jaddy @rstockm

                              Libraries/Frameworks, Schönes Beispiel, ja …

                              Ich fang in Cursor damit an das mit ein llm erstmal eine spec und Architektur und requirements schreibt, aus einem offenen Brainstorming mit dem Agenten. Da gehört auch dazu, die Frage zu klären welche libraries/Frameworks man für bestimmte Aspekte nutzen kann und welch pro und con es gibt. Wenn ich dann angebe dass ich kein Enterprise ready riesenframework brauche sondern genau einen Aspekt betrachtet und gelöst haben will, dann kann mir das llm verschiedene Optionen vorschlagen, inkl
                              Selbstschreiben, und ich kann dann als Architekt das Vorgehen bestimmen.
                              Am Ende giest der Agent das Brainstorming in die beiden Files Requirements.md und Techspec.md und das sind die ersten Files im Git Repo.
                              Meine Cursor-Rules sagen, dass diese beiden Files immer wieder Teil des Context sind und zu beachten sind.
                              natürlich können die sich in den nachfolgenden Sessions auch noch angepasst werden … neue offene Fragen werden dort erörtert und beantwortet.
                              Ein anderer Agent erstellt dann aus diesen Files einen Plan zum abarbeiten und erst die dritte Agent-Session erzeugt überhaupt Code und trackt den Fortschritt im Plan.

                              Ja, das ist kein OneShot… das ist den Juniordev an die Hand nehmen und ihm logische Planung abnehmen.

                              Man kann den Junior DEV benutzen und mit ihm produktiv sein. Man kann sich so verhalten, dass man dem juniodev die ganze Zeit Rätsel gibt, die die graue Emminenz kennt und dem Junior dann vor dem Kopf knallen, wie doof er ist. Ich bin gespannt wie lange das im reallife gut geht.

                              Ralph hat oben mwn nicht behauptet dass die llms alle auf architektenlevel arbeiten. das ist es aber was viele aufgrund des Hypes da rein interpretieren.
                              Nein! das sind erstmal dumme Juniors die nur bis zur nächsten Frage denken können und wenn man ihnen nicht genug Context gibt, bzw nicht weiß wie man das macht, der ist enttäuscht…

                              Sorry for the longread, my 2ct

                              jaddy@friend.enby-box.deJ 1 Antwort Letzte Antwort
                              0
                              • jwalzer@infosec.exchangeJ jwalzer@infosec.exchange

                                @jaddy @rstockm

                                Libraries/Frameworks, Schönes Beispiel, ja …

                                Ich fang in Cursor damit an das mit ein llm erstmal eine spec und Architektur und requirements schreibt, aus einem offenen Brainstorming mit dem Agenten. Da gehört auch dazu, die Frage zu klären welche libraries/Frameworks man für bestimmte Aspekte nutzen kann und welch pro und con es gibt. Wenn ich dann angebe dass ich kein Enterprise ready riesenframework brauche sondern genau einen Aspekt betrachtet und gelöst haben will, dann kann mir das llm verschiedene Optionen vorschlagen, inkl
                                Selbstschreiben, und ich kann dann als Architekt das Vorgehen bestimmen.
                                Am Ende giest der Agent das Brainstorming in die beiden Files Requirements.md und Techspec.md und das sind die ersten Files im Git Repo.
                                Meine Cursor-Rules sagen, dass diese beiden Files immer wieder Teil des Context sind und zu beachten sind.
                                natürlich können die sich in den nachfolgenden Sessions auch noch angepasst werden … neue offene Fragen werden dort erörtert und beantwortet.
                                Ein anderer Agent erstellt dann aus diesen Files einen Plan zum abarbeiten und erst die dritte Agent-Session erzeugt überhaupt Code und trackt den Fortschritt im Plan.

                                Ja, das ist kein OneShot… das ist den Juniordev an die Hand nehmen und ihm logische Planung abnehmen.

                                Man kann den Junior DEV benutzen und mit ihm produktiv sein. Man kann sich so verhalten, dass man dem juniodev die ganze Zeit Rätsel gibt, die die graue Emminenz kennt und dem Junior dann vor dem Kopf knallen, wie doof er ist. Ich bin gespannt wie lange das im reallife gut geht.

                                Ralph hat oben mwn nicht behauptet dass die llms alle auf architektenlevel arbeiten. das ist es aber was viele aufgrund des Hypes da rein interpretieren.
                                Nein! das sind erstmal dumme Juniors die nur bis zur nächsten Frage denken können und wenn man ihnen nicht genug Context gibt, bzw nicht weiß wie man das macht, der ist enttäuscht…

                                Sorry for the longread, my 2ct

                                jaddy@friend.enby-box.deJ This user is from outside of this forum
                                jaddy@friend.enby-box.deJ This user is from outside of this forum
                                jaddy@friend.enby-box.de
                                schrieb zuletzt editiert von
                                #36
                                @jwalzer @rstockm Genau so arbeite ich auch. Bei größeren Projekten auch mit Projektplan und Meilensteinen, die ich den Agent erstellen und pflegen lasse, die ich aber prüfe und abändere, bevor ich das Go gebe.
                                Kleinschrittiges Arbeiten scheint bei mir nötig, um Limits und Degradation zu vermeiden.
                                Die Pläne und Doku sind auch nötig, um zu archivieren und irgendwann später wieder aufsetzen zu können. Es ist schon erstaunlich was bei „erstelle eine vollständige Doku mit Spezifikationen, Entscheidungen und Erkenntnissen, um später in einem neuen Chat fortsetzen zu können" alles entsteht.
                                1 Antwort Letzte Antwort
                                0
                                Antworten
                                • In einem neuen Thema antworten
                                Anmelden zum Antworten
                                • Älteste zuerst
                                • Neuste zuerst
                                • Meiste Stimmen



                                Copyright (c) 2025 abSpecktrum (@abspecklog@fedimonster.de)

                                Erstellt mit Schlaflosigkeit, Kaffee, Brokkoli & ♥

                                Impressum | Datenschutzerklärung | Nutzungsbedingungen

                                • Anmelden

                                • Du hast noch kein Konto? Registrieren

                                • Anmelden oder registrieren, um zu suchen
                                • Erster Beitrag
                                  Letzter Beitrag
                                0
                                • Home
                                • Aktuell
                                • Tags
                                • Über dieses Forum