近日,AI界掀起了一股新风潮,一款名为Llama3-V的全新开源视觉大语言模型横空出世!据悉,这款模型基于Llama38B和siglip-so400m,被称为最先进的视觉大语言模型之一。与此同时,该模型还具备快速本地推理的特点,让用户能够更加便捷地进行推理操作。
有关Llama3-V的一些关键特点包括:优于LLaVA约10-20%的性能表现、训练成本低于500美元以及可与GPT4-V、Gemini Ultra和Claude3相媲美的性能。同时,该模型的权重、训练和推理代码也将会开源发布,让更多的开发者能够参与其中。
现在,Llama3-V已经在Hugging Face平台和Github上发布,吸引了大量关注和好评。据悉,这款模型不仅能够优于以往的同类产品,还能够以更小的模型体积达到与其他大型模型相媲美的性能水平。
总的来说,Llama3-V的推出无疑将为AI领域带来一股新的风向,让我们拭目以待,看这款模型能为人工智能领域带来怎样的突破与创新!
HF Model:https://huggingface.co/mustafaaljadery/llama3v…
Github Repo:https://github.com/mustafaaljadery/llama3v