Helpdesk com Inteligência Artificial: Arquitetura e Design da SOPHIA-HL1

🤖 Saudações, cibernautas e entusiastas da Matrix! Quem vos fala é Éder, diretamente dos confins do The Web Scrolls, onde a tecnologia encontra o bizarro e o futuro se dobra ao nosso olhar pixelizado. A Lullucy está por aí, provavelmente hackeando algum servidor interestelar ou ajustando a curvatura do espaço-tempo no Lullucyverso. Enquanto isso, eu estive nas trincheiras digitais, forjando uma inteligência artificial com esteroides de dados para um concurso aqui na firma. Falei sobre o assunto há alguns posts e estou devendo a continuação dessa saga. E tenho muitas novidades, mas, como sempre, prefiro ir por partes. Mas deixo aqui um spoiler: meu projeto foi finalista do Concurso e, posteriormente, um dos três ganhadores.

Preparem seus óculos de realidade aumentada, porque hoje vamos mergulhar na arquitetura secreta do SUPORTE ORIENTADO POR HEURÍSTICA COM IA (SOPHIA)!


Robô Sophia em um laboratório de tecnologia atendendo uma ligação e consultando um bloco de notas enquanto é observada por analistas humanos

Quem quiser ler primeiro o post de apresentação do projeto, basta clicar aqui.

Como Funciona por Trás das Cortinas: a arquitetura do Suporte Orientado Por Heurística com IA

Imagine SOPHIA como um cérebro digital turbinado, conectado a veias de dados e com a sagacidade de um chatbot que assistiu a todos os filmes cyberpunk clássicos. Para que essa maravilha da engenharia de software funcione, existe uma dança complexa de componentes e fluxos de informação.


Diagrama de Fluxo do Projeto Sophia, exibindo as principais etapas do algoritmo (de forma simplificada)

No coração da SOPHIA reside a seguinte arquitetura simplificada:

  1. Conexão com o Banco de Dados de Tickets: O primeiro passo é sugar os dados brutos dos tickets de suporte técnico. Pense nisso como conectar um cabo neural diretamente na mente da máquina de helpdesk. Através de programação Python, o sistema estabelece uma ligação com o banco de dados, permitindo o acesso automatizado às informações dos chamados.
  2. Processamento dos Anexos: Tickets raramente vêm sem companhia. Imagens de erros bizarros (prints de tela) e manuais técnicos em formato PDF são comuns. SOPHIA não se assusta com esses formatos. Futuramente vou implementar uma função para que SOPHIA possa ler anexos do tipo planilha também.
    1. Imagens: Para extrair texto de imagens, integrei a biblioteca EasyOCR. Essa ferramenta faz um OCR (Reconhecimento Óptico de Caracteres) localmente, transformando aqueles rabiscos pixelizados em texto que a IA pode entender. Essa decisão técnica foi crucial, pois o uso excessivo da API Gemini para OCR com uma chave gratuita era limitante. O EasyOCR oferece suporte a diversos idiomas e scripts de escrita, o que é vital para um ambiente corporativo diversificado.
    2. PDFs: Para os manuais e documentos em PDF, o sistema implementa uma função de conversão para texto. Assim, o conteúdo desses arquivos também se torna inteligível para a análise da IA.
  3. Seleção Inteligente de Manuais Técnicos: Aqui a coisa começa a ficar interessante. Em vez de despejar todos os manuais técnicos de uma vez na cabeça da IA (o que ultrapassaria os limites de dados da API Gemini), SOPHIA utiliza sua inteligência embrionária para escolher o manual mais relevante para cada ticket. Um algoritmo analisa o contexto geral do chamado e seleciona o manual mais apropriado de uma lista predefinida, baseando-se em descrições resumidas fornecidas ao sistema. É como ter um bibliotecário cibernético que sabe exatamente qual tomo abrir para resolver o problema.
  4. Análise com a IA Generativa Gemini: Com os dados do ticket, o texto extraído dos anexos e o manual técnico (se aplicável), tudo é encaminhado para o "cérebro" de SOPHIA: a API Gemini do Google. Uma "instrução complexa" é enviada para a API, detalhando as análises desejadas. Isso inclui:
    1. Definir a prioridade estratégica do ticket.
    2. Verificar e corrigir a categorização.
    3. Identificar o tipo de requisição.
    4. Avaliar o grau de dificuldade.
    5. Sugerir ações, soluções e respostas iniciais. Para acessar a API Gemini, é necessário obter uma chave de API. O projeto utilizou a capacidade da API Gemini para gerar texto a partir das informações fornecidas. Modelos como o Gemini 2.0 Flash podem ser usados para essa finalidade.
  5. Interface de Usuário e Relatórios: Para tornar toda essa análise acessível aos analistas de suporte, utilizei a biblioteca Streamlit. Essa ferramenta em Python permite construir interfaces web interativas de forma rápida e fácil. Através dessa interface, as análises da IA podem ser visualizadas diretamente na tela. Além disso, o sistema é capaz de gerar relatórios completos por e-mail em diversos formatos: PDF, áudio (gerado com a biblioteca gTTS) e CSV, consolidando todas as informações relevantes.

Decisões Técnicas Cruciais:

  • A escolha do Python como linguagem de programação principal pela sua vasta gama de bibliotecas para manipulação de dados e integração com APIs de IA.
  • A integração do EasyOCR para o processamento local de imagens, otimizando o uso da chave gratuita da API Gemini e garantindo a funcionalidade de OCR.
  • A estratégia de fazer a própria IA selecionar o manual técnico mais relevante, contornando as limitações de entrada de dados da API Gemini.
  • O uso do Streamlit para criar uma interface amigável e acessível, transformando dados complexos em insights visuais e relatórios práticos.

Em suma, a arquitetura de SOPHIA é uma sinergia entre a coleta inteligente de dados, o processamento eficiente de diferentes formatos de arquivo e o poder analítico da IA Generativa, tudo orquestrado para auxiliar as equipes de suporte técnico em um mundo cada vez mais caótico e cheio de glitches.

Fiquem ligados para mais incursões no mundo da IA e da tecnologia aqui no The Web Scrolls. E lembrem-se, a realidade é apenas um código esperando para ser decifrado!

Em breve volto para falar mais sobre esse projeto e seus desdobramentos, incluindo os pontos que precisam ser melhorados no futuro, bem como para compartilhar o código fonte no GitHub para os entusiastas que quiserem estudar as estratégias para criarem seus próprios robôs de software.


Comentários