摩根大通发布了DocLLM,一款专为多模态文档理解设计的生成式语言模型,通过轻量级扩展LLM,避免昂贵的图像编码器,以提高文档分析效能。
7️⃣ ScriptGPT 🚀
据悉,M2UGen采用了创新的方法,生成了大规模的多模态音乐指导数据集,用于训练模型。这包括MU-LLaMA模型生成的1.2k多小时音乐字幕数据集。模型结合了MU-LLaMA、BLIP图像字幕模型、MPT-7B-Chat模型以及VideoMAE字幕模型,以在各个领域生成对应的指导。
Inpaint_wechat的开发过程中借鉴了inpaint_web项目,成功实现了该功能从web平台到微信小程序的迁移。这意味着用户可以在微信平台上方便地使用这一实用功能。
29. AI支持的危机沟通与Chat GPT:在危机期间提供实时沟通,确保快速传播准确一致的信息。