Alarm bei OpenStreetMap!
-
Alarm bei OpenStreetMap!
Das freie Kartenprojekt steht vor einer ernsten Herausforderung: Tausende KI-Bots greifen aktuell massenhaft Daten ab und bringen damit das gesamte Projekt in Gefahr.Zum Artikel: https://heise.de/-11156876?wt_mc=sm.red.ho.mastodon.mastodon.md_beitraege.md_beitraege&utm_source=mastodon
#OpenStreetMap #KünstlicheIntelligenz #Datenschutz #DigitaleInfrastruktur #FreiesSoftwareprojekt
@heiseonline Kann man die nicht grundsätzlich aussperren???

-
Hi, kurze Nachfrage: Meint ihr mit „OSM missbrauchen“ auch Projekte wie meines?
Ich nutze OSM/uMap nur als Basiskarte/Layout.
Die gemeldeten Inhalte (Heatmap-Reports) sind komplett eigene Daten und werden nicht in OSM zurückgeschrieben.Mir ist wichtig, OSM nicht zu belasten oder zu schaden.
Falls das Projekt größer wird, würde ich selbstverständlich auf eigene Tile-/Hosting-Lösungen umsteigen bzw. dafür bezahlen.Danke für jeden Hinweis!
@HeatmapofFascism @heiseonline
Das ist ja legitim - auch ich verwende die OpenStreetMap-Anwendung Leaflet für die interaktive Karte auf meiner Wiki.
Aber diese Crawler könnten einfach die Rohdaten der Karten runterladen - und stattdessen machen die das über die API.
-
@HeatmapofFascism @heiseonline
Das ist ja legitim - auch ich verwende die OpenStreetMap-Anwendung Leaflet für die interaktive Karte auf meiner Wiki.
Aber diese Crawler könnten einfach die Rohdaten der Karten runterladen - und stattdessen machen die das über die API.
-
@HeatmapofFascism @heiseonline
Das ist ein allgemeines Problem - wie ich auch auf meiner Webseite feststelle, stellen Crawler inzwischen die Mehrheit des Internet-Traffics dar. Und die haben auch keine Hemmungen, dieselbe Webseite immer und immer wieder zu crawlen, obwohl das gar nicht nötig wäre.
-
@mardor @heiseonline Es is vor allem so unendlich lazy. Die sollen einfach täglich die diffs vom World file runter laden und selbst hosten, statt die public API voll zu spammen.
Einfach radikal rate-limiten.
@climbertobby @mardor @heiseonline
Das passiert, wenn man die Bots auch per Vipe Coding schreibt und nur im als Zielsetzung die Funktion auf seiner Seite in Betracht zieht. Hauptsache meine Seite (gewünschte Funktion) funktioniert reibungslos über alles andere mache ich mir keine Gedanken.
Ich mag echt den Ansatz Gzip Bombe.
https://www.phpbb.com/community/viewtopic.php?p=16081531&hilit=11G#p16081531
-
@HeatmapofFascism @heiseonline
Das ist ein allgemeines Problem - wie ich auch auf meiner Webseite feststelle, stellen Crawler inzwischen die Mehrheit des Internet-Traffics dar. Und die haben auch keine Hemmungen, dieselbe Webseite immer und immer wieder zu crawlen, obwohl das gar nicht nötig wäre.
ok also diese blutsauger AI-Bots
ja ich verstehe wo die reise hin geht grade...
traurig.
-
Alarm bei OpenStreetMap!
Das freie Kartenprojekt steht vor einer ernsten Herausforderung: Tausende KI-Bots greifen aktuell massenhaft Daten ab und bringen damit das gesamte Projekt in Gefahr.Zum Artikel: https://heise.de/-11156876?wt_mc=sm.red.ho.mastodon.mastodon.md_beitraege.md_beitraege&utm_source=mastodon
#OpenStreetMap #KünstlicheIntelligenz #Datenschutz #DigitaleInfrastruktur #FreiesSoftwareprojekt
-
Alarm bei OpenStreetMap!
Das freie Kartenprojekt steht vor einer ernsten Herausforderung: Tausende KI-Bots greifen aktuell massenhaft Daten ab und bringen damit das gesamte Projekt in Gefahr.Zum Artikel: https://heise.de/-11156876?wt_mc=sm.red.ho.mastodon.mastodon.md_beitraege.md_beitraege&utm_source=mastodon
#OpenStreetMap #KünstlicheIntelligenz #Datenschutz #DigitaleInfrastruktur #FreiesSoftwareprojekt
@heiseonline Ist dies nicht gerade etwas für @algernon #iocaine?
-
Hi, kurze Nachfrage: Meint ihr mit „OSM missbrauchen“ auch Projekte wie meines?
Ich nutze OSM/uMap nur als Basiskarte/Layout.
Die gemeldeten Inhalte (Heatmap-Reports) sind komplett eigene Daten und werden nicht in OSM zurückgeschrieben.Mir ist wichtig, OSM nicht zu belasten oder zu schaden.
Falls das Projekt größer wird, würde ich selbstverständlich auf eigene Tile-/Hosting-Lösungen umsteigen bzw. dafür bezahlen.Danke für jeden Hinweis!
@HeatmapofFascism @heiseonline Es geht nicht um die Nutzung der Tileserver die werden längst über einen kommerziellen Dienst gecached.
Es geht um Zugriffe auf die von den Mappern erfassten Objekte die man eigentlich auch komplett als Panetfile downloaden kann. Das zu scrapen ist komplett sinnlos weil diese Daten gibt es in maschinenlesbarer Form direkt zum vollständigen download. -
@heiseonline Ist dies nicht gerade etwas für @algernon #iocaine?
@Soundtrackcity @heiseonline I don't speak German well enough, but I've read OSM's toots, I assume it's the same topic, especially due to the hashtag.

Happy to help in whatever way I can (doesn't necessarily involve iocaine, a lot of the traffic can be mitigated by a few lines of reverse proxy/webserver configuration1), but I don't have the capacity to reach out to them.
If they ping me, or someone connects us, I'll do my best. But reaching out myself is not something I can do at the moment.
-
@Soundtrackcity @heiseonline I don't speak German well enough, but I've read OSM's toots, I assume it's the same topic, especially due to the hashtag.

Happy to help in whatever way I can (doesn't necessarily involve iocaine, a lot of the traffic can be mitigated by a few lines of reverse proxy/webserver configuration1), but I don't have the capacity to reach out to them.
If they ping me, or someone connects us, I'll do my best. But reaching out myself is not something I can do at the moment.
@algernon @heiseonline Dear Mouse with unlucky dice, thank you for replying! I just hope someone in charge at OSM will pick this up so they can shield themselves from the bombardments…
-
L luettdeern@plasmatrap.com shared this topic
︎