新万博ManBetX入口并设置了 Whisper 音频转录模子来克服艰巨-万博max体育在线登录

发布日期:2024-05-06 07:05    点击次数:105

新万博ManBetX入口并设置了 Whisper 音频转录模子来克服艰巨-万博max体育在线登录

IT之家 4 月 7 日音讯,本周早些时候,《华尔街日报》报谈称 AI 公司在集结高质料西席数据方面遭受了艰巨。今天,《纽约时报》详确先容了 AI 公司科罚此问题的一些设施,其中触及到属于 AI 版权法糊涂灰色区域的实质。

报谈称,OpenAI 伏击需要西席数据,并设置了 Whisper 音频转录模子来克服艰巨,转录了卓著 100 万小时的 YouTube 视频来西席其泉源进的大型说话模子 GPT-4。

报谈提到,OpenAI 在 2021 年浮滥了灵验的数据供应,并在浮滥其他资源后参议了转录 YouTube 视频、播客和有声读物的可行性。此外,OpenAI 使用了包括来自 Github 的考虑机代码、海外象棋走棋数据库和来自 Quizlet 的功课实质。

据报谈,OpenAI 公司知谈这在法律上存在问题,但觉得这是合理使用。《泰晤士报》则清楚,OpenAI 总裁 Greg Brockman 亲身参与了所使用视频的集结。

OpenAI 发言东谈主 Lindsay Held 在一封电子邮件中告诉 The Verge,该公司为其每个模子筹谋了“特有”的数据集,以“匡助他们了解寰球”并保持其各人说合竞争力。Held 补充说,该公司使用“广宽来源,包括公开数据和非公开数据的配结伴伴”,而且正在洽商生成我方的合成数据。

谷歌发言东谈主 Matt Bryant 在一封电子邮件中示意,该公司“看到了联系 OpenAI 行径的未经确认的文牍”,并补充说“咱们的 robots.txt 文献(IT之家注:网站与爬虫间的正人协定)和作事要求王人不容未经授权的捏取或下载 YouTube 实质”。

IT之家防护到,YouTube 首席实行官 Neal Mohan 近日在采访中公开示意,尽管莫得径直字据标明 OpenAI 使用 YouTube 视频来西席 Sora(文本生成视频的 AI 模子),但教化称这种动作违背了 YouTube 现行的平台作事要求。

Meta 相同也遭受了数据可用性的适度,在《泰晤士报》听到的灌音中,Meta 的 AI 团队为了勤勉追逐 OpenAI,参议了未经许可使用版权作品的情况。该公司在浏览了“互联网上险些可用的英语竹素、散文、诗歌和新闻著述”后,显然洽商聘请一些步履,举例支付史籍许可用度,致使径直管购一家大型出书商。

告白声明:文内含有的对外跳转衔接(包括不限于超衔接、二维码、口令等体式),用于传递更多信息,省俭甄选本事,后果仅供参考,IT之家总计著述均包含本声明。

  声明:新浪网独家稿件,未经授权不容转载。 -->