全球最大的商业图库Getty Images上周宣布推出高画质照片样本训练数据集,供开发者开发和训练AI模型使用。该样本数据集包含3,750张照片,分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等15个类别。这些图片选集已经在Hugging Face上架,用户需同意服务条款并提供联系方式才能免费访问该数据集。
Getty Images希望通过这个免费样本数据集吸引企业和开发者使用其付费授权服务。该公司声称自己拥有超过5.72亿张照片,其中2亿多张可用于商业用途。每张照片附有结构化的元数据,包括年龄、性别等信息,每张图片平均有50个关键词,以确保用户安全训练模型,并避免侵权诉讼风险。
评论