- A empresa chinesa disponibilizou gratuitamente para uso comercial e de pesquisa dois de seus grandes modelos de linguagem, Qwen-7B e Qwen-7B-Chat
- A Alibaba Cloud, que está prestes a se tornar uma empresa independente de sua controladora no próximo ano, tem investido cada vez mais em IA generativa em meio a uma frenesi global em torno do ChatGPT
A Alibaba Cloud, a plataforma de tecnologia digital do Alibaba Group Holding, compartilhou publicamente dois de seus grandes modelos de linguagem (LLMs, da sigla em inglês), à medida que a gigante chinesa de tecnologia busca expandir sua influência no campo da inteligência artificial generativa (IA).
Os dois modelos de código aberto, Qwen-7B e Qwen-7B-Chat, foram treinados em 7 bilhões de parâmetros cada. O Qwen-7B-Chat é uma versão ajustada do Qwen-7B capaz de realizar conversas semelhantes às humanas. Eles representam formas mais simples do Tongyi Qianwen (que significa buscar a verdade através de mil perguntas), o LLM que a unidade de serviços de computação em nuvem da Alibaba lançou em abril.
Te podría interesar
Os mecanismos internos desses modelos, incluindo seus códigos e documentação, estarão disponíveis gratuitamente para estudiosos, pesquisadores e instituições comerciais em todo o mundo através do repositório de modelos de IA ModelScope da Alibaba Cloud e da plataforma colaborativa de IA Hugging Face dos EUA, informou a empresa sediada em Hangzhou.
Empresas com menos de 100 milhões de usuários ativos por mês poderão implantar os modelos de código aberto para uso comercial sem custo, enquanto aquelas com mais usuários precisarão solicitar uma licença da Alibaba Cloud.
Te podría interesar
Código aberto
Os LLMs são algoritmos de inteligência artificial de aprendizado profundo que podem reconhecer, resumir, traduzir e gerar conteúdo usando conjuntos de dados muito grandes. A tecnologia é usada para treinar chatbots altamente inteligentes, como o ChatGPT da OpenAI, que gerou imenso interesse global desde seu lançamento em novembro.
A abertura do código-fonte dos LLMs faz parte dos esforços mais amplos da Alibaba para "democratizar" a tecnologia de IA e oferecer suporte a startups de LLM, disse a empresa.
"Nosso objetivo é promover tecnologias inclusivas e permitir que mais desenvolvedores e pequenas e médias empresas aproveitem os benefícios da IA generativa", disse Zhou Jingren, diretor de tecnologia da Alibaba Cloud Intelligence.
A Alibaba se junta a seus pares no Ocidente que abriram seus LLMs para uso gratuito. O Llama 2, o LLM de código aberto de próxima geração criado pelo proprietário do Facebook, Meta Platforms, foi adicionado à plataforma ModelScope da Alibaba no mês passado, tornando-o acessível a desenvolvedores na China.
O ModelScope, uma plataforma de "modelo como serviço" lançada em novembro, atualmente conta com mais de mil modelos de IA prontos para uso, contribuídos por 20 principais instituições de IA, abrangendo áreas desde visão computacional até processamento de linguagem natural.
A Alibaba Cloud, que está prestes a ser separada de sua controladora no próximo ano e se tornar uma empresa de capital aberto, tem intensificado o desenvolvimento e a comercialização de IA generativa em meio à frenesi global em torno do ChatGPT.
Na Conferência Mundial de Inteligência Artificial em Xangai, em julho, a empresa apresentou o Tongyi Wanxiang, um modelo de geração de imagens no estilo Midjourney projetado para apoiar desenvolvedores e empresas menores.
A receita da nuvem da Alibaba no trimestre de março caiu 2% em relação ao ano anterior, contribuindo com 9% do total de receitas do grupo, de acordo com seu último relatório financeiro. A empresa divulgará seus resultados do trimestre de junho na próxima semana.
Com informações do SCMP