
ROTEIRO AULA PRATICA
Roteiro DE AULA Prática – Machine Learning II
Teorias Da Administração (Unopar)
lOMoARcPSD|52372665
Roteiro
Aula Prática
MACHINE LEARNING II
P˙blico
lOMoARcPSD|52372665
ROTEIRO DE AULA PRÁTICA
NOME DA DISCIPLINA: Machine Learning II
Unidade: 1 – Métodos de Amostragem e Modelos Preditivos
Aula: 3 – Modelos Supervisionados
P ˙bli c2o
Permitir que o aluno compreenda e implemente o algoritmo de agrupamento K-means, explorando
sua aplicação em um conjunto de dados bidimensional.
Definição dos objetivos da aula prática:
OBJETIVOS
PyCharm é um ambiente de desenvolvimento integrado usado para programação em Python.
Ele fornece análise de código, um depurador gráfico, um testador de unidade integrado,
integração com sistemas de controle de versão e suporta desenvolvimento web com Django,
que pode ser acessado em https://www.jetbrains.com/pt-br/pycharm/
SOLUÇÃO DIGITAL:
Pycharm
Procedimento/Atividade nº 1
Desenvolvimento de um algoritmo em Python para analisar a função do K-means.
Atividade proposta: Desenvolver um algoritmo k-means, utilizando linguagem de programação
Python e suas bibliotecas sklearn, matplotlib e numpy.
Procedimentos para a realização da atividade:
Crie um algoritmo que utilize a função K-means da biblioteca sklearn.cluster. Para este exercício,
siga os passos a seguir:
Para a nossa base de dados, crie as seguintes matrizes:
x = [4, 5, 10, 4, 3, 11, 14, 6, 10, 12]
y = [21, 19, 24, 17, 16, 25, 24, 22, 21, 21]
PROCEDIMENTOS PRÁTICOS E APLICAÇÕES
lOMoARcPSD|52372665
Depois da criação da base de dados, transforme-a em um conjunto de pontos.
Para encontrar o melhor valor para K, precisamos executar K-means em nosso conjunto
de pontos para uma variedade de valores possíveis. Temos apenas 10 pontos de dados,
então o número máximo de clusters é 10. Portanto, para cada valor K no intervalo (1,11),
treinamos um modelo K-means e plotamos o resultado.
Ajuste o seu K para 2 e plote os diferentes clusters atribuídos aos dados.
Avaliando os resultados:
O código desenvolvido implementa a análise de agrupamento em um conjunto de dados
bidimensional utilizando o algoritmo K-Means. O código deve criar um conjunto de dados
representado por duas listas de valores correspondentes às coordenadas x e y. A partir desses
dados, deve-se calcular a inércia para diferentes quantidades de clusters, variando de 1 a 10, e
construir um gráfico que permita identificar o número ideal de clusters através do método do
cotovelo (Elbow Method). Esse gráfico será fundamental para determinar o ponto em que a adição
de novos clusters deixa de trazer ganhos significativos em termos de redução de inércia.
Após determinar o número ideal de clusters, aplique o algoritmo K-Means para agrupar os dados
e visualize os resultados em um gráfico de dispersão. Nesse gráfico, os dados devem ser
apresentados com cores diferentes para cada cluster, facilitando a interpretação visual dos
agrupamentos formados. Certifique-se de utilizar as bibliotecas apropriadas para manipulação e
visualização de dados, como `matplotlib` e `sklearn`, garantindo que os resultados sejam claros
e bem estruturados.
Checklist:
Desenvolver um algoritmo usando Python e K-means.
Gerar um conjunto de dados bidimensional representado por duas listas de valores.
Plotar gráficos com o resultado do treinamento de K-means.
Avaliar os resultados.
P ˙bli c3o
RESULTADOS
lOMoARcPSD|52372665
Resultados do experimento:
Ao final dessa aula prática, você deverá enviar um arquivo em pdf contendo o código
desenvolvido e os gráfico gerados. O arquivo não pode exceder o tamanho de 2Mb.
Resultados de Aprendizagem:
Como resultados dessa prática será possível compreender os fundamentos do algoritmo KMeans e o uso do método do cotovelo para determinar o número ideal de clusters. Além disso, é
desenvolvidas habilidades práticas em Python, manipulando dados bidimensionais e utilizando
bibliotecas como sklearn e matplotlib para análise e visualização.
lOMoARcPSD|52372665