O modelo revolucionário de IA superando o ChatGPT!

2023-11-27 795 words 4 minutes

Contents

-Negócios -Bate-papoGPT

Dentre os diversos LLM (grandes modelos linguísticos) apresentados no último período, entre os que mais se destacam está certamente o OpenChat. Esta é uma ferramenta apresentada em novembro de 2023 que “apenas” conta 7 bilhões de parâmetros (7B), mas que consegue superar o ChatGPT (OpenAI) em vários benchmarks de referência.

O que é OpenChat e como funciona

OpenChat é uma biblioteca inovadora que integra modelos de linguagem de código aberto, submetidos a cuidadosas atividades de otimização (ajuste fino).

C-RLFT (Conditioned Reinforcement Learning Fine-tuning) é uma estratégia utilizada pelo OpenChat no processo de treinamento de modelos linguísticos que se inspira na aprendizagem reforçada offline. EU'aprendizado reforçado é uma técnica utilizada para treinar inteligência artificial por meio da interação com o ambiente, recebendo feedback em forma de recompensas ou “punições”. A indicação offline refere-se ao fato de o treinamento não ocorrer em tempo real, mas utilizar dados previamente coletados.

No caso do OpenChat, o aprendizado por reforço offline é utilizado para melhorar as respostas por meio da avaliação de conversas passadas e a consequente atualização do modelo.

Usando o OpenChat, você pode obter desempenho comparável ao ChatGPT, mesmo usando uma GPU"consumidora"(por exemplo, uma NVidia Geforce RTX 3090 ).

Principais características do modelo

-Dimensões e desempenho do modelo: o modelo de 7 bilhões de parâmetros ( OpenChat-3.5-7B ) que alcançou resultados comparáveis com ChatGPT em vários benchmarks. OpenChat-3.5 alcançou pontuações impressionantes em vários benchmark, superando outros modelos de código aberto, como OpenHermes 2.5 e OpenOrca Mistral, em métricas como MT-Bench, AGIEval, BBH MC, TruthfulQA, MMLU, HumanEval, BBH CoT e GSM8K.

-Atualizações frequentes: o OpenChat lança regularmente novas versões e atualizações. Por exemplo, o modelo OpenChat-3.5-7B foi lançado recentemente em 1º de novembro de 2023. -Licença e acessibilidade: uma ferramenta como o OpenChat é distribuída sob a licença Apache-2.0, tornando-a de código aberto e acessível. Os usuários podem instalá-lo usando pip ou conda. -APIs de servidor: OpenChat oferece uma API pronta para uso em ambientes de produção que, entre outras coisas, é totalmente compatível com o protocolo OpenAI API. A arquitetura do software permite, entre outras coisas, processar dinamicamente as solicitações recebidas em blocos (lotes). -Interface de usuário da Web (IU da Web): juntamente com APIs para facilitar o diálogo com dispositivos clientes, o OpenChat fornece uma IU da Web que simplifica a interação com o modelo.

Como experimentar o OpenChat

Uma demonstração de acesso aberto foi fornecida pelos criadores do OpenChat, permitindo aos usuários transmitir uma sequência de consultas ao modelo generativo e avaliar as respostas por ele geradas.

Na página principal dos chatbots open source, conversas e prompts podem ser criados. O sistema é capaz de acompanhar as informações transferidas para ele durante a mesma conversa.

Pode-se também manipular os parâmetros de temperatura para gerar resultados mais imprevisíveis e imaginativos (aumentando o valor) ou, alternativamente, mais exatos e específicos (diminuindo o valor).

Ao clicar em Configurações, na coluna da esquerda, você também pode especificar um tema diferente e optar por aquele com fundo claro.

As conversas possuem a capacidade de serem expatriadas e reimportadas, erradicadas a critério de cada um e administradas de forma abrangente.

Para instalar e use OpenChat localmente , a solução mais simples é usar o Ollama carregando o framework dentro de um contêiner Docker:

docker exec-it ollama ollama execute openchat

Detalhes adicionais podem ser encontrados no repositório oficial do OpenChat GitHub.

Treinamento e personalização

O modelo linguístico subjacente ao funcionamento do OpenChat também pode aprender com as conversas fornecidas como entrada, adaptando o seu comportamento e respostas aos dados disponibilizados. As seguintes atividades de treinamento (treinamento) permitem adaptar o modelo às necessidades específicas do usuário e do contexto.

Antes de iniciar o treinamento, você precisa selecionar um modelo base para treinar no ajuste fino. OpenChat suporta modelos como Llama 2 e Mistral, cada um com dimensões e características específicas.

Os dados de treinamento são obviamente essenciais. No OpenChat, as conversas são representadas na forma de objetos JSON: cada linha corresponde a um objeto “Conversa” contendo mensagens de “usuário” e “assistente” com rótulos e pesos relacionados.

O conjunto de dados que você deseja"alimentar"para o OpenChat deve ser pré-tokenizado. Este processo envolve a conversão de dados em um formato tokenizado usando um modelo específico. Este é um passo importante para agilizar a fase de treinamento.

O treinamento real envolve a otimização de parâmetros do modelo: OpenChat usa DeepSpeed , variante do PyTorch para treinamento distribuído em hardware acelerado por GPU. Durante o treinamento, são gerados checkpoints do modelo em intervalos regulares. São diferentes “estados” do modelo generativo: ao final do treinamento é possível avaliar o checkpoint para escolher a versão do modelo que você considera melhor.

Crédito da imagem de abertura: iStock.com/Shutthiphong Chandaeng

barra lateral inferior relacionada 300

*️⃣ Link da fonte:

demonstração online gratuita , repositório oficial do GitHub , Shutthipong Chandaeng,