面壁智能开源了端侧多模态模型 MiniCPM-Llama3-V 2.5,且支持 30+ 多种语言。 MiniCPM-Llama3-V 2.5 是 MiniCPM-V系列的最新、性能最佳模型。总参数量8B,多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型,OCR 能力及指令跟随能力进一步提升——精准识别难图长图长文本,并支持超过3...

新闻来源:面壁智能开源端侧多模态大模型:MiniCPM-Llama3-V 2.5