Não são necessárias habilidades técnicas!

Benjamin Kawaski included in Artificial Intelligence Tech Algorithm Chatbot Deep Learning Hugging Face Machine Learning

2024-01-14 1730 words 9 minutes

Contents

A Inteligência Artificial (IA) permanece em grande parte confinada ao domínio da imaginação popular, com a maioria dos indivíduos interagindo principalmente através de plataformas de conversação como ChatGPT e experiências visuais facilitadas pelo Midjourney. Embora alguns possam se aventurar além desses limites, experimentando ferramentas avançadas de geração de imagens, como o Dall-E, ou aproveitando os recursos inovadores incorporados em aplicativos como a câmera Google Pixel, essa exploração normalmente não vai muito além.

Muito poucos indivíduos possuem a capacidade de implantar e utilizar um sistema completo de inteligência artificial em seus computadores pessoais. Esse tipo de empreendimento geralmente exige a navegação em um processo altamente técnico que envolve o trabalho com códigos de computador complexos. Ainda mais notável, é necessário reservar capacidade de armazenamento suficiente no seu dispositivo para fins de instalação; conforme evidenciado pelo tamanho substancial do modelo de linguagem Mistral AI de aproximadamente 87 gigabytes.

“A plataforma onde a comunidade de aprendizado de máquina colabora em modelos, conjuntos de dados e aplicativos. »//Fonte: Captura de tela

Existe uma opção alternativa que permite a operação de modelos de IA sem qualquer ação específica necessária. Basta acessar o site Hugging Face por meio de um navegador da web. Embora este método tenha as suas limitações, fornece demonstrações básicas em vez de resultados avançados obtidos através de uma configuração abrangente.

Embora estes modelos possam fornecer apenas uma compreensão superficial das suas capacidades, eles servem como um meio acessível de introduzir o tema da inteligência artificial. Para quem tiver interesse em se aprofundar, poderá acessar diretamente o modelo e ajustar sua configuração.

As tarefas ficam ocultas no menu na parte superior do site. Siga as caixas laranja.//Fonte: Captura de tela

Em 12 de janeiro de 2024, Hugging Face catalogou mais de 464.000 modelos de IA em seu repositório. Esta extensa coleção inclui contribuições de vários líderes do setor, como Microsoft, OpenAI (responsável por projetos notáveis como ChatGPT e Dall-E), Mistral AI, Meta Corporation (organização controladora do Facebook) e até mesmo Google. Além disso, existem inúmeras iniciativas não divulgadas, uma das quais é o altamente aclamado modelo de IA baseado no Mickey Mouse, que agora está acessível ao público em geral.

Para se tornar proficiente na utilização de inteligência artificial através do Hugging Face, não é necessário necessariamente uma familiaridade íntima com todos os aspectos de suas capacidades. Em vez disso, basta visitar a seção “Tarefas” nesta plataforma para categorizar os modelos disponíveis com base em seus respectivos temas, como visão computacional, processamento automatizado de linguagem natural, áudio, aprendizagem por reforço-um método para aumentar progressivamente as potencialidades da IA e multimodal, em que uma forma de dados serve como estímulo para gerar outro tipo distinto de dados, por exemplo, transformar texto em imagens visuais.

À esquerda, o princípio do modelo. À direita, a demonstração que você pode testar imediatamente.//Fonte: Captura de tela

Cada domínio da visão computacional e do áudio abrange tarefas distintas, como estimar a profundidade das imagens, realizar a detecção de objetos, classificar imagens e transcrever a linguagem falada. Além disso, a conversão entre diferentes formatos de mídia é possível através de abordagens multimodais que permitem conversões de texto para vídeo e de imagem para 3D, entre outras.

Ao navegar pelo site do Hugging Face, os usuários podem encontrar diversas seções de interesse, inclusive aquelas referentes à classificação de imagens. Ao selecionar uma categoria específica, uma página dedicada exibindo mais de 9.000 modelos disponíveis pode ser acessada. Contudo, não é necessário examinar cada modelo individualmente; em vez disso, apenas um é necessário para resultados satisfatórios.

Nesta demonstração, a Torre Eiffel não foi reconhecida. Mas podemos pelo menos ter uma ideia do que o modelo está fazendo.//Fonte: Captura de tela

A classificação de imagens envolve alimentar uma imagem a um modelo para análise, com o objetivo de atribuir rótulos apropriados para classificar o conteúdo da imagem. Por exemplo, dada uma imagem de entrada representando um gato na natureza, a IA pode rotulá-lo como um “gato egípcio”, ao mesmo tempo que oferece rótulos alternativos como “malhado” (referindo-se ao padrão de pelagem do gato) ou simplesmente “gato”.

O usuário tem a opção de selecionar um modelo de demonstração no lado direito da página, podendo implementá-lo imediatamente tirando uma fotografia do computador ou usando o recurso arrastar e soltar para acessar imagens da internet. Como alternativa, a imagem pode ser baixada antes de ser carregada no Hugging Face. Iniciado o processo, informamos ao usuário o modelo utilizado, que neste caso é uma variante do Vision Transformer do Google.

Mantenha-se atualizado com os últimos desenvolvimentos em inteligência artificial inscrevendo-se em nosso boletim informativo, que é de autoria de um sistema de IA de última geração.

Manifestações acima de tudo

os modelos residentes no Hugging Face para avaliações em tempo real podem não exibir sua capacidade completa, levando a uma qualidade de resposta ou renderização abaixo do ideal.

Explorar as aplicações potenciais da inteligência artificial vai além da mera curiosidade; em vez disso, implica apresentar uma série de opções disponíveis aos usuários. Embora a execução local destes modelos possa produzir resultados mais abrangentes, a necessidade de requisitos técnicos específicos, como download, instalação e configuração, torna esta opção menos acessível a todos os indivíduos.

Fonte: Captura de tela

O restante desta página apresenta um vídeo instrutivo no idioma inglês, referente a vários cenários de utilização, incluindo funcionalidades de pesquisa textual e baseada em imagens. Além disso, fornece recomendações sobre seleção de modelos, conjuntos de dados de referência, recursos pertinentes e detalhes de compatibilidade relativos a bibliotecas de software relevantes. Esses componentes atendem especificamente a um público com conhecimento consideravelmente maior. Da mesma forma, o conteúdo contido nas páginas que detalham os próprios modelos é adaptado para uma base de usuários igualmente avançada.

Explorar a seção “Espaços” do Hugging Face oferece uma oportunidade para os usuários descobrirem vários aplicativos de aprendizado de máquina desenvolvidos na comunidade. Esta plataforma oferece uma oportunidade única de obter alguns insights sobre possíveis casos de uso em inteligência artificial. Por exemplo, um desses aplicativos chamado AI Comic Factory permite que os indivíduos criem histórias em quadrinhos personalizadas com base no tópico ou gênero escolhido. Ao inserir um conceito narrativo e selecionar um estilo de arte específico, esta ferramenta gera ilustrações visualmente atraentes para dar vida à sua história imaginativa.

No LongAnimateDiff, é possível gerar uma imagem e animá-la. A renderização não é incrível, mas continua sendo uma demonstração.//Fonte: Captura de tela

Organizar Espaços pode não ser tão simples quanto gerenciar Tarefas, mas ainda é possível organizar os aplicativos disponíveis com base nas tendências predominantes, popularidade e atualizações ou criações recentes. Embora isso forneça algumas informações sobre as tendências atuais, a determinação da função exata de cada aplicativo dentro de um Espaço pode nem sempre ser imediatamente aparente. Nesses casos, clicar em um determinado Espaço e examinar a descrição que o acompanha torna-se necessário para compreender sua finalidade.

Estou entrando nos quadrinhos

A Transcrição de Rede Neural Recorrente do Parakeet (RNNT) versão 1.1B é capaz de converter o áudio capturado por um microfone em texto escrito por meio da tecnologia de reconhecimento de fala. Por outro lado, o PASD Magnifier melhora a qualidade visual das imagens ao mesmo tempo que as personaliza de acordo com as preferências individuais. O modelo de demonstração IP-Adapter-FaceID Plus transforma imagens usando algoritmos avançados de reconhecimento facial. A ferramenta Open-Vocabulary Scene Text Detection permite aos usuários selecionar elementos específicos em uma imagem e identificá-los com precisão. Existem também certas aplicações que possuem funcionalidades ambíguas, exigindo execução para compreender os fins a que se destinam.

Um exemplo básico com AI Comic Factory.//Fonte: Captura de tela

O intrigante aplicativo descoberto na página inicial do Spaces, intitulado “AI Comic Factory”, emprega inteligência artificial para gerar quadrinhos personalizados. Ao inserir uma diretiva específica, conhecida como “prompt”, no início, os usuários podem selecionar entre uma variedade de estilos distintos, como arte neutra, japonesa, franco-belga ou até mesmo medieval. Além disso, também podem ser selecionadas opções para incorporar balões de diálogo nas ilustrações, com um total de dezesseis parâmetros personalizáveis disponíveis para melhorar a experiência geral do usuário.

Na verdade, a plataforma demonstra capacidades impressionantes através da sua interface amigável. Ao simplesmente fornecer um aviso como “um avião em chamas, caindo no chão”, gera uma narrativa coerente. Além disso, os usuários têm a opção de modificar e refinar suas criações, modificando elementos individuais nas cenas, incluindo adicionar, excluir ou editar partes específicas do texto. A rapidez com que estes ajustes são feitos é igualmente louvável, destacando a eficiência desta ferramenta digital.

Outro exemplo, com prompt diferente e estilo próximo ao mangá.//Fonte: Captura de tela

O processo de edição permite modificar o conteúdo do prompt, que é invariavelmente composto no idioma inglês. Neste caso, a AI Comic Factory criou uma representação visual na forma de uma página digital colorida de quadrinhos, apresentando uma ilustração de quadrinhos moderna em estilo americano. A cena retrata uma figura heróica, retratada como um bombeiro de cabelos loiros curtos e físico bem definido, que utiliza uma lanterna para examinar o entorno. Vestido com um traje composto por botas pretas, calças e uma jaqueta vermelha adornada com um capacete prateado brilhante, ele fica em meio a uma paisagem caótica caracterizada por terreno lamacento e detritos espalhados.

Essas ofertas de demonstração fornecem um meio conveniente para indivíduos com conhecimento técnico limitado acessarem recursos de inteligência artificial sem exigir amplo conhecimento ou experiência anterior. Contudo, a disponibilidade e funcionalidade de tais demonstrações dentro dos limites das plataformas espaciais dependem do fornecimento da infra-estrutura tecnológica necessária. Embora certos recursos possam ser oferecidos gratuitamente, outros podem acarretar taxas associadas, que podem variar consideravelmente em magnitude. Em última análise, a responsabilidade pela determinação dos custos associados à utilização de funcionalidades específicas do modelo cabe às respectivas partes interessadas e não aos próprios utilizadores finais.

Conheça este site\+

A assinatura de nossa estimada publicação por meio da estimada plataforma do Google Notícias é altamente recomendada para aqueles que desejam se manter atualizados com os eventos e desenvolvimentos atuais em tempo hábil, para não serem privados de informações vitais que possam impactar significativamente sua compreensão do mundo ao seu redor..

*️⃣ Link da fonte:

Hugging Face , lista mais de 464.000 modelos de IA , Tarefas , a classificação de uma imagem , uma versão do Vision Transformer do Google, Espaços , AI Comic Factory , Periquito RNNT 1.1B , PASD Ampliar , Adaptador IP-FaceID Mais demonstração , SAM de vocabulário aberto , AI Comic Factory , recursos técnicos disponibilizados ,