Olá meu povo, como conversamos no video, seguem codigos para implementação do coeficiente de determinação R² e o dataset.
#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Sat Mar 27 10:20:53 2021 @author: rafaeldontalgoncalez """ ###################################### # REGRESSAO LINEAR ###################################### ###################################### # Importando as libraries ###################################### import pandas as pd import sklearn.model_selection as ms import sklearn.linear_model as lm import matplotlib.pyplot as plt ###################################### # Importa o dataset ###################################### dataset = pd.read_csv("/Users/rafaeldontalgoncalez/Movies/YT/dba_sql_us_salary_experience.csv") dataset = dataset.dropna() X = dataset.iloc[:, :-1] y = dataset.iloc[:, -1] ###################################### # Separar dados em Treino e Teste ###################################### X_train, X_test, y_train, y_test = ms.train_test_split(X, y, random_state = 0) ###################################### # Treinando o modelo ###################################### regressor = lm.LinearRegression() regressor.fit(X_train, y_train) ###################################### # Previsao ###################################### y_pred = regressor.predict(X_test) ###################################### # Visualizando o treino ###################################### plt.scatter(X_train, y_train, color = 'red') plt.plot(X_train, regressor.predict(X_train), color = 'blue', scaley=False) plt.title('Treino') plt.show() ###################################### # Visualizando o teste ###################################### plt.scatter(X_test, y_test, color = 'red') plt.plot(X_train, regressor.predict(X_train), color = 'blue', scaley=False) plt.title('Teste') plt.show() ###################################### # Valor Especifico ###################################### print(regressor.predict([[10]])) ###################################### # R^2 - Performance do modelo ###################################### from sklearn.metrics import r2_score r2_score(y_test, y_pred)
#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Tue Mar 9 18:32:09 2021 @author: rafaeldontalgoncalez """ ###################################### # Importando as bibliotecas ###################################### import numpy as np import matplotlib.pyplot as plt import pandas as pd from sklearn.tree import DecisionTreeRegressor import sklearn.model_selection as ms ###################################### # Importa o dataset ###################################### dataset = pd.read_csv('/Users/rafaeldontalgoncalez/Movies/YT/dba_sql_us_salary_experience.csv') dataset = dataset.dropna() X = dataset.iloc[:, 0].values.reshape(-1,1) y = dataset.iloc[:, -1].values.reshape(-1,1) ###################################### # Separar dados em Treino e Teste ###################################### X_train, X_test, y_train, y_test = ms.train_test_split(X, y, random_state = 0) ###################################### # Treinando o modelo para regressao de arvore de decisao ###################################### regressor = DecisionTreeRegressor(min_samples_split=10) regressor.fit(X_train,y_train) ###################################### # Previsao ###################################### y_pred = regressor.predict(X_test) ###################################### # Imprime a regressao de arvore de decisao ###################################### plt.scatter(X_test, y_test, color = 'red') plt.plot(X_train, regressor.predict(X_train), color = 'blue') plt.title('Regressao de Arvore de Decisao') plt.xlabel('Anos de Experiencia') plt.ylabel('Salario') plt.show() ###################################### # Prevendo resultados para regressao de arvore de decisao ###################################### print('5 anos =', regressor.predict([[5]])) print('6 anos =', regressor.predict([[6]])) print('8 anos =', regressor.predict([[8]])) print('11 anos =', regressor.predict([[11]])) print('12 anos =', regressor.predict([[12]])) print('20 anos =', regressor.predict([[20]])) print('27 anos =', regressor.predict([[27]])) print('28 anos =', regressor.predict([[28]])) print('31 anos =', regressor.predict([[31]])) print('33 anos =', regressor.predict([[33]])) print('37 anos =', regressor.predict([[37]])) print('43 anos =', regressor.predict([[43]])) print('47 anos =', regressor.predict([[47]])) print('48 anos =', regressor.predict([[48]])) print('78 anos =', regressor.predict([[78]])) ###################################### # R^2 - Performance do modelo ###################################### from sklearn.metrics import r2_score r2_score(y_test, y_pred)
#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Thu Feb 24 22:55:59 2021 @author: rafaeldontalgoncalez """ ###################################### # Importando as bibliotecas ###################################### import numpy as np import matplotlib.pyplot as plt import pandas as pd from sklearn.preprocessing import StandardScaler from sklearn.svm import SVR import sklearn.model_selection as ms ###################################### # Importa o dataset ###################################### dataset = pd.read_csv('/Users/rafaeldontalgoncalez/Movies/YT/dba_sql_us_salary_experience.csv') X = dataset.iloc[:, 0].values.reshape(-1,1) y = dataset.iloc[:, -1].values.reshape(-1,1) ###################################### # Feature Scalling ###################################### sc_X = StandardScaler() sc_y = StandardScaler() X = sc_X.fit_transform(X) y = sc_y.fit_transform(y) ###################################### # Separar dados em Treino e Teste ###################################### X_train, X_test, y_train, y_test = ms.train_test_split(X, y, random_state = 0) ###################################### # Treinando o modelo para SVR ###################################### regressor = SVR(kernel='rbf') regressor.fit(X_train,y_train) ###################################### # Previsao ###################################### y_pred = regressor.predict(X_test) ###################################### # Imprime a regressao SVR ###################################### plt.scatter(X_test, y_test, color = 'red') plt.plot(X_train, regressor.predict(X_train), color = 'blue') plt.title('Regressao SVR') plt.xlabel('Anos de Experiencia') plt.ylabel('Salario') plt.show() ###################################### # Prevendo resultados para regressao de vetor suporte ###################################### sc_y.inverse_transform(regressor.predict(sc_X.transform([[7.5]]))) ###################################### # R^2 - Performance do modelo ###################################### from sklearn.metrics import r2_score r2_score(y_test, y_pred)
Dataset: dba_sql_us_salary_experience