• GCostanzaStepOnMe@feddit.de
    link
    fedilink
    Deutsch
    arrow-up
    3
    arrow-down
    4
    ·
    1 year ago

    Sehe ich anders, habe aber auch keine Expertise auf dem Gebiet.

    Scraper sind schlecht für die IT Infrastruktur, gleichzeitig sind sie auch nerviger zu entwickeln als eine API zu verwenden. Es kann gut sein dass sich Reddit mit der Industrie auf einen Mittelweg geeinigt hat. Anderalls wäre es unklar wieso sie die Preise anheben, und nicht einfach die API abstellen.

        • CookieJarObserver@feddit.de
          link
          fedilink
          Deutsch
          arrow-up
          3
          ·
          1 year ago

          Es geht halt grundsätzlich viel schneller als sich erst mit einer api rum zu schlagen, du brauchst die Daten ja nur ein mal. Und dann benutzen diese Unternehmen eben auch selbst KI die erkennt welche Daten relevant für Mashine learning sind, was mit KI Scrapern besser geht, die Firmen die das machen sind relativ verschwiegen was das sourcing angeht, und meine Quelle dazu ist das einer meiner freunde bei einer training data machenden firma arbeitet und mir deren system mal erklärt hab, die Quelle ist eben nirgends nieder geschrieben. Du musst mir diesbezüglich also nicht glauben, wenn du aber eine Quelle findest die etwas anderes behauptet (die nichts mit Reddit oder Twitter zu tun hat) würde ich mir das gern anschauen, ich binn schließlich auch nicht unfehlbar und Quelle: “Vertrau mir brudi” ist halt Kaum belegbar.