A Etapa de Treinamento de Algoritmos de Machine Learning

No artigo O que é Machine Learning, explicamos de maneira superficial o que significa essa técnica e como pode ser aplicada. Neste artigo, vamos aprofundar a explicação um pouco mais, explorando algumas das principais abordagens da técnica.

Tipos de Algoritmo

Existem dois tipos principais de algoritmos de aprendizado usados em Machine Learning: aprendizado supervisionado e aprendizado não supervisionado. A escolha de qual tipo de algoritmo usar depende da aplicação.

O aprendizado supervisionado é o tipo mais comum. Na fase de treino, o algoritmo é alimentado com entradas e suas respectivas saídas desejadas — O exemplo do filtro de spam, visto acima e ilustrado na Figura 1, usa um algoritmo de aprendizado supervisionado, já que na fase de treino os emails estão classificados entre spam ou legítimo. O aprendizado não supervisionado, por sua vez, é util quando não se sabe previamente a que grupo cada entrada pertence. Os grupos são determinados na fase de treino com base em atributos comuns entre as entradas. Um exemplo de aplicação é quando uma empresa deseja classificar seus usuários em diversos segmentos de mercado (Figura 2). Esses segmentos nem sempre são bem definidos previamente mas o uso do aprendizado não supervisionado pode ajudar a detectar padrões e a definir estratégias de marketing direcionadas.

Um ponto comum entre todas as técnicas de Machine Learning é: quanto mais dados, melhor. Intuitivamente, se no filtro de spam nós treinarmos o algoritmo usando poucos emails, é bastante improvável que na fase de execução ele se saia bem. No entanto, um problema colateral de usar uma grande quantidade de dados é a necessidade de uma maior capacidade de processamento na fase de treino. Felizmente, esse problema é amenizado usando computação em nuvem, já que os recursos computacionais podem ser alocados sob demanda, diminuindo os custos.

Aplicações

Algumas aplicações de Machine Learning são tão comuns — como reconhecimento de voz e imagem — que algumas empresas oferecem soluções já prontas. Um exemplo disso é a Amazon Web Services (AWS), que possui um serviço de reconhecimento de voz (Amazon Lex) e um de reconhecimento de imagens (Amazon Rekognition). A vantagem em usar essas soluções é que essas empresas possuem uma grande quantidade de dados e, portanto, podem treinar algoritmos mais robustos.

Embora uma grande quantidade de dados ajude na obtenção de resultados melhores com Machine Learning, os algoritmos e técnicas empregados também são decisivos. Problemas diferentes exigem ferramentas diferentes e o maior desafio costuma ser saber como usá-las e definir qual é a melhor para resolver o seu problema. Caso queira saber mais sobre como usar Machine Learning no seu negócio, não deixe de entrar em contato.

Entre em Contato