{"id":169601,"date":"2024-07-16T17:19:55","date_gmt":"2024-07-16T15:19:55","guid":{"rendered":"https:\/\/www.apfelpage.de\/?p=169601"},"modified":"2024-07-16T17:19:55","modified_gmt":"2024-07-16T15:19:55","slug":"aerger-mit-youtubern-apple-und-co-saugen-massenhaft-untertitel-fuer-ki-training-ab","status":"publish","type":"post","link":"https:\/\/www.apfelpage.de\/news\/aerger-mit-youtubern-apple-und-co-saugen-massenhaft-untertitel-fuer-ki-training-ab\/","title":{"rendered":"\u00c4rger mit YouTubern: Apple und Co. saugen massenhaft Untertitel f\u00fcr KI-Training ab"},"content":{"rendered":"
Apple und andere Tech-Giganten sorgen f\u00fcr Unmut bei YouTubern. Sie trainierten ihre KI-Modelle offenbar massenhaft mit Videos tausender Channel-Betreiber und zwar ohne daf\u00fcr eine Erlaubnis einzuholen. Die Unternehmen wollen diese Vorw\u00fcrfe nicht kommentieren, aus gutem Grund.<\/strong><\/p>\n Moderne gro\u00dfe Sprachmodelle wissen heute eine ganze Menge \u00fcber die Welt. Sie beziehen ihre Kenntnisse aus dem umfangreichen Datensatz, mit denen sie trainiert wurden. Daten sind f\u00fcr KI-Unternehmen hinter ChatGPT und Co. das Erd\u00f6l der heutigen Zeit, schon zuvor tauchten einige brennende Fragen im Zusammenhang mit dem Training von Sprachmodellen auf.<\/p>\n Nun haben mehrere Unternehmen sich den \u00c4rger gro\u00dfer YouTube-Kan\u00e4le eingehandelt. Anthropic, Nvidia, Apple und Salesforce trainierten ihre Modelle offenbar mit riesigen Datenmengen, die unter anderem von gro\u00dfen YouTube-Kan\u00e4len abgesaugt worden waren.<\/p>\n Hierzu wurden die h\u00e4ufig separat hochgeladenen Untertiteldateien abgesaugt und in die Trainingsdatens\u00e4tze eingespeist. Auf eine \u00e4hnliche Weise arbeiten vorgefertigte GPT-Derivate, die YouTube-Videos zusammenfassen. Sie werden nicht wirklich die Videos aus, sondern erstellen eine Zusammenfassung auf Basis der Untertiteldatei, sofern verf\u00fcgbar.<\/p>\n Wie das Magazin Wired berichtet<\/a>, wurden Untertitel von <\/span>173.536 Videos gesammelt, sie umfassen Daten von mehr als 48.000 Kan\u00e4len.<\/span><\/p>\n Unter den Channel-Betreibern, deren Untertitel eingespeist wurden, finden sich so illustre Namen wie <\/span>Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver und Jimmy Kimmel.<\/span><\/p>\n Das automatisierte massenhafte Sammeln und Drittverwerten von Daten ist laut der Statuten von YouTube eigentlich nicht gestattet. Ob Apple und Co. nun effektiv \u00c4rger mit YouTube oder den Kanalbetreibern bekommen werden, ist noch nicht klar, die Streitfrage ist aber zun\u00e4chst einmal in der Welt.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":" Apple und andere Tech-Giganten sorgen f\u00fcr Unmut bei YouTubern. Sie trainierten ihre KI-Modelle offenbar massenhaft mit Videos tausender Channel-Betreiber und zwar ohne daf\u00fcr eine Erlaubnis einzuholen. Die Unternehmen wollen diese Vorw\u00fcrfe nicht kommentieren, aus gutem Grund. Moderne gro\u00dfe Sprachmodelle wissen heute eine ganze Menge \u00fcber die Welt. Sie beziehen ihre Kenntnisse aus dem umfangreichen Datensatz, … Weiterlesen …<\/a><\/p>\n","protected":false},"author":68,"featured_media":168763,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","enabled":false},"version":2}},"categories":[3],"tags":[8162,1615],"appful":[],"class_list":["post-169601","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-apple","tag-ai","tag-youtube"],"jetpack_publicize_connections":[],"yoast_head":"\nTranskripte f\u00fcr KI-Training genutzt<\/h2>\n