Es geht halt grundsätzlich viel schneller als sich erst mit einer api rum zu schlagen, du brauchst die Daten ja nur ein mal. Und dann benutzen diese Unternehmen eben auch selbst KI die erkennt welche Daten relevant für Mashine learning sind, was mit KI Scrapern besser geht, die Firmen die das machen sind relativ verschwiegen was das sourcing angeht, und meine Quelle dazu ist das einer meiner freunde bei einer training data machenden firma arbeitet und mir deren system mal erklärt hab, die Quelle ist eben nirgends nieder geschrieben. Du musst mir diesbezüglich also nicht glauben, wenn du aber eine Quelle findest die etwas anderes behauptet (die nichts mit Reddit oder Twitter zu tun hat) würde ich mir das gern anschauen, ich binn schließlich auch nicht unfehlbar und Quelle: “Vertrau mir brudi” ist halt Kaum belegbar.
Kannst du das auch belegen?
Es geht halt grundsätzlich viel schneller als sich erst mit einer api rum zu schlagen, du brauchst die Daten ja nur ein mal. Und dann benutzen diese Unternehmen eben auch selbst KI die erkennt welche Daten relevant für Mashine learning sind, was mit KI Scrapern besser geht, die Firmen die das machen sind relativ verschwiegen was das sourcing angeht, und meine Quelle dazu ist das einer meiner freunde bei einer training data machenden firma arbeitet und mir deren system mal erklärt hab, die Quelle ist eben nirgends nieder geschrieben. Du musst mir diesbezüglich also nicht glauben, wenn du aber eine Quelle findest die etwas anderes behauptet (die nichts mit Reddit oder Twitter zu tun hat) würde ich mir das gern anschauen, ich binn schließlich auch nicht unfehlbar und Quelle: “Vertrau mir brudi” ist halt Kaum belegbar.