Name: O modelo certo para a tarefa certa: estratégias de roteamento para LLMs
Start: 2025-06-10T18:00:00-03:00
End: 2025-06-10T19:00:00-03:00

Bluetalks são encontros vibrantes com discussões aprofundadas sobre tecnologia e inovação, apresentando os mais recentes projetos de pesquisa da IBM Research Brasil.

Com o crescente número de opções de Modelos de Linguagem de Grande Escala (LLMs) de código aberto, é comum utilizarmos dados de benchmark para compará-los. Essas comparações são fundamentais para escolher o melhor modelo para cada caso de uso, analisando qual apresenta melhor desempenho e precisão, auxiliando no processo de tomada de decisões. Embora alguns grandes modelos se destaquem em muitos benchmarks, nenhum modelo, isoladamente, atinge a melhor precisão em todos os tipos de tarefas e aplicações.

Nesta apresentação, vamos explorar um estudo [1] que aborda o desafio de selecionar o melhor LLM entre um conjunto de modelos para novas tarefas. O estudo utiliza conjuntos de dados de benchmarks para desenvolver um novo modelo de "roteador" que ajuda na seleção do LLM mais adequado. Além disso, apresentaremos a plataforma de coleta de dados para treinamento do CARROT [2], um roteador que pode selecionar modelos com base em qualquer compensação desejada com base em estimativas de custo e desempenho dos modelos.

[1] Large Language Model Routing with Benchmark Datasets [https://arxiv.org/pdf/2309.15789 ](https://arxiv.org/pdf/2309.15789)
[2] CARROT: A Cost Aware Rate Optimal Router [https://arxiv.org/abs/2502.03261](https://arxiv.org/abs/2502.03261)

Larissa Rios

Rodrigo Bandarra

Bluetalks

IBM Community

Technology

Software Development

Cloud Computing

New Technology

Researchers

DevOps

OpenStack

Open Source

Artificial Intelligence

SaaS (Software as a Service)

**Allysson Oliveira**

Engenheiro de software formado na Universidade de Fortaleza, trabalho no Think Lab liderando um time de desenvolvimento na prototipação de de soluções inovadoras baseadas em pesquisas do laboratório de pesquisas da IBM Brasil.

Com mais de 20 anos de experiência na área, tendo trabalhado no desenvolvimento de produtos (telefonia móvel) passando por todo rigoroso ciclo de desenvolvimento para garantir a qualidade máxima do produto. Também trabalhei no desenvolvimento de uma plataforma educacional sendo ponto focal e coordenando um time externo.

No Think Lab construímos protótipos perseguindo a excelência em engenharia de software e usando metodologia ágil para garantir a priorização e alinhamento estratégico das nossas entregas. Procuramos sempre as melhores soluções considerando aspectos de escalabilidade, arquitetura orientada a micro serviços, utilização de PaaS (IBM Cloud), etc.
[https://www.linkedin.com/in/allysson-oliveira/](https://www.linkedin.com/in/allysson-oliveira/)

**Mirian Silva**

Mirian Silva é Engenheira de IA no time IBM AI Models, trabalhando principalmente com modelos de fundação/LLM e IA generativa. Possui Mestrado em Ciência da Computação pela Universidade Federal de Minas Gerais (UFMG, Brasil), com pesquisa baseada em IA focada na equidade de aprendizado de máquina, mitigação de viés e práticas de avaliação. Bacharelada em Matemática Computacional, um curso baseado em ciência da computação e matemática aplicada, pela mesma universidade (UFMG). É membro da comunidade Black in AI; um espaço para compartilhar ideias, fomentar colaborações e discutir iniciativas para aumentar a presença de pessoas negras no campo da Inteligência Artificial.
[https://www.linkedin.com/in/mirianfsilva/](https://www.linkedin.com/in/mirianfsilva/)

O modelo certo para a tarefa certa: estratégias de roteamento para LLMs

Detalhes