Coeficiente de Determinação R² na Prática em Python

Olá meu povo, como conversamos no video, seguem codigos para implementação do coeficiente de determinação R² e o dataset.

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Sat Mar 27 10:20:53 2021

@author: rafaeldontalgoncalez
"""
######################################
# REGRESSAO LINEAR
######################################


######################################
# Importando as libraries
######################################

import pandas as pd
import sklearn.model_selection as ms
import sklearn.linear_model as lm
import matplotlib.pyplot as plt

######################################
# Importa o dataset
######################################


dataset = pd.read_csv("/Users/rafaeldontalgoncalez/Movies/YT/dba_sql_us_salary_experience.csv")
dataset = dataset.dropna()
X = dataset.iloc[:, :-1]
y = dataset.iloc[:, -1]

######################################
# Separar dados em Treino e Teste
######################################

X_train, X_test, y_train, y_test = ms.train_test_split(X, y, random_state = 0)


######################################
# Treinando o modelo
######################################

regressor = lm.LinearRegression()
regressor.fit(X_train, y_train)

######################################
# Previsao
######################################

y_pred = regressor.predict(X_test)

######################################
# Visualizando o treino
######################################

plt.scatter(X_train, y_train, color = 'red')
plt.plot(X_train, regressor.predict(X_train), color = 'blue', scaley=False)
plt.title('Treino')
plt.show()

######################################
# Visualizando o teste
######################################

plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_train, regressor.predict(X_train), color = 'blue', scaley=False)
plt.title('Teste')
plt.show()

######################################
# Valor Especifico
######################################

print(regressor.predict([[10]]))


######################################
# R^2 - Performance do modelo
######################################
from sklearn.metrics import r2_score
r2_score(y_test, y_pred)

 

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Tue Mar  9 18:32:09 2021

@author: rafaeldontalgoncalez
"""

######################################
# Importando as bibliotecas
######################################

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.tree import DecisionTreeRegressor
import sklearn.model_selection as ms

######################################
# Importa o dataset
######################################

dataset = pd.read_csv('/Users/rafaeldontalgoncalez/Movies/YT/dba_sql_us_salary_experience.csv')
dataset = dataset.dropna()
X = dataset.iloc[:, 0].values.reshape(-1,1)
y = dataset.iloc[:, -1].values.reshape(-1,1)


######################################
# Separar dados em Treino e Teste
######################################

X_train, X_test, y_train, y_test = ms.train_test_split(X, y, random_state = 0)


######################################
# Treinando o modelo para regressao de arvore de decisao
######################################

regressor = DecisionTreeRegressor(min_samples_split=10)
regressor.fit(X_train,y_train)

######################################
# Previsao
######################################

y_pred = regressor.predict(X_test)


######################################
# Imprime a regressao de arvore de decisao
######################################


plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_train, regressor.predict(X_train), color = 'blue')
plt.title('Regressao de Arvore de Decisao')
plt.xlabel('Anos de Experiencia')
plt.ylabel('Salario')
plt.show()


######################################
# Prevendo resultados para regressao de arvore de decisao
######################################

print('5 anos =', regressor.predict([[5]]))
print('6 anos =', regressor.predict([[6]]))
print('8 anos =', regressor.predict([[8]]))
print('11 anos =', regressor.predict([[11]]))
print('12 anos =', regressor.predict([[12]]))
print('20 anos =', regressor.predict([[20]]))
print('27 anos =', regressor.predict([[27]]))
print('28 anos =', regressor.predict([[28]]))
print('31 anos =', regressor.predict([[31]]))
print('33 anos =', regressor.predict([[33]]))
print('37 anos =', regressor.predict([[37]]))
print('43 anos =', regressor.predict([[43]]))
print('47 anos =', regressor.predict([[47]]))
print('48 anos =', regressor.predict([[48]]))
print('78 anos =', regressor.predict([[78]]))

######################################
# R^2 - Performance do modelo
######################################

from sklearn.metrics import r2_score
r2_score(y_test, y_pred)
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Thu Feb 24 22:55:59 2021

@author: rafaeldontalgoncalez
"""

######################################
# Importando as bibliotecas
######################################

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVR
import sklearn.model_selection as ms


######################################
# Importa o dataset
######################################

dataset = pd.read_csv('/Users/rafaeldontalgoncalez/Movies/YT/dba_sql_us_salary_experience.csv')
X = dataset.iloc[:, 0].values.reshape(-1,1)
y = dataset.iloc[:, -1].values.reshape(-1,1)

######################################
# Feature Scalling
######################################
sc_X = StandardScaler()
sc_y = StandardScaler()
X = sc_X.fit_transform(X)
y = sc_y.fit_transform(y)


######################################
# Separar dados em Treino e Teste
######################################

X_train, X_test, y_train, y_test = ms.train_test_split(X, y, random_state = 0)


######################################
# Treinando o modelo para SVR
######################################
regressor = SVR(kernel='rbf')
regressor.fit(X_train,y_train)

######################################
# Previsao
######################################

y_pred = regressor.predict(X_test)


######################################
# Imprime a regressao SVR
######################################


plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_train, regressor.predict(X_train), color = 'blue')
plt.title('Regressao SVR')
plt.xlabel('Anos de Experiencia')
plt.ylabel('Salario')
plt.show()


######################################
# Prevendo resultados para regressao de vetor suporte
######################################

sc_y.inverse_transform(regressor.predict(sc_X.transform([[7.5]])))


######################################
# R^2 - Performance do modelo
######################################

from sklearn.metrics import r2_score
r2_score(y_test, y_pred)

Dataset: dba_sql_us_salary_experience