{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": { "id": "xwFyEsosINqT" }, "outputs": [], "source": [ "import numpy as np\n", "import pandas as pd" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "id": "pKewSQysItJ-" }, "outputs": [], "source": [ "# https://www.statsmodels.org/stable/index.html\n", "import statsmodels.api as sm" ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "id": "Lz-DyAtNWsJR" }, "outputs": [], "source": [ "# Download Dataset from https://www.dropbox.com/scl/fi/zt2vtwhpz8ndblsxqdqx1/Salary_MIS.xlsx?rlkey=2uk6m7m9w90isv6zsynhhhpyv&st=gxumjns5&dl=1\n", "# and add it to colab" ] }, { "cell_type": "code", "execution_count": 4, "metadata": { "id": "6rRHygNBIpgA" }, "outputs": [], "source": [ "sallaryMisDf = pd.read_excel(\"https://www.dropbox.com/scl/fi/zt2vtwhpz8ndblsxqdqx1/Salary_MIS.xlsx?rlkey=2uk6m7m9w90isv6zsynhhhpyv&st=gxumjns5&dl=1\")" ] }, { "cell_type": "code", "execution_count": 5, "metadata": { "id": "0zM8FGMJXJ70" }, "outputs": [], "source": [ "# sallaryMisDf = pd.read_excel(\"./Salary_MIS.xlsx\")" ] }, { "cell_type": "code", "execution_count": 6, "metadata": { "id": "wsIgDGYcXT_z" }, "outputs": [ { "data": { "text/html": [ "
| \n", " | Salary | \n", "GPA | \n", "MIS | \n", "Statistics | \n", "
|---|---|---|---|---|
| 0 | \n", "72 | \n", "3.53 | \n", "1 | \n", "0 | \n", "
| 1 | \n", "66 | \n", "2.86 | \n", "1 | \n", "0 | \n", "
| 2 | \n", "72 | \n", "3.69 | \n", "0 | \n", "0 | \n", "
| 3 | \n", "63 | \n", "3.24 | \n", "0 | \n", "0 | \n", "
| 4 | \n", "65 | \n", "3.21 | \n", "0 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 115 | \n", "66 | \n", "3.27 | \n", "0 | \n", "0 | \n", "
| 116 | \n", "63 | \n", "2.86 | \n", "1 | \n", "0 | \n", "
| 117 | \n", "78 | \n", "3.04 | \n", "1 | \n", "1 | \n", "
| 118 | \n", "64 | \n", "2.99 | \n", "0 | \n", "0 | \n", "
| 119 | \n", "66 | \n", "3.65 | \n", "0 | \n", "0 | \n", "
120 rows × 4 columns
\n", "| \n", " | Salary | \n", "GPA | \n", "MIS | \n", "Statistics | \n", "
|---|---|---|---|---|
| count | \n", "120.000000 | \n", "120.000000 | \n", "120.000000 | \n", "120.000000 | \n", "
| mean | \n", "69.875000 | \n", "3.242750 | \n", "0.316667 | \n", "0.341667 | \n", "
| std | \n", "6.594577 | \n", "0.493834 | \n", "0.467127 | \n", "0.476257 | \n", "
| min | \n", "53.000000 | \n", "2.410000 | \n", "0.000000 | \n", "0.000000 | \n", "
| 25% | \n", "65.750000 | \n", "2.805000 | \n", "0.000000 | \n", "0.000000 | \n", "
| 50% | \n", "70.000000 | \n", "3.280000 | \n", "0.000000 | \n", "0.000000 | \n", "
| 75% | \n", "73.250000 | \n", "3.692500 | \n", "1.000000 | \n", "1.000000 | \n", "
| max | \n", "88.000000 | \n", "3.980000 | \n", "1.000000 | \n", "1.000000 | \n", "
| \n", " | const | \n", "GPA | \n", "MIS | \n", "Statistics | \n", "
|---|---|---|---|---|
| 0 | \n", "1.0 | \n", "3.53 | \n", "1 | \n", "0 | \n", "
| 1 | \n", "1.0 | \n", "2.86 | \n", "1 | \n", "0 | \n", "
| 2 | \n", "1.0 | \n", "3.69 | \n", "0 | \n", "0 | \n", "
| 3 | \n", "1.0 | \n", "3.24 | \n", "0 | \n", "0 | \n", "
| 4 | \n", "1.0 | \n", "3.21 | \n", "0 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 115 | \n", "1.0 | \n", "3.27 | \n", "0 | \n", "0 | \n", "
| 116 | \n", "1.0 | \n", "2.86 | \n", "1 | \n", "0 | \n", "
| 117 | \n", "1.0 | \n", "3.04 | \n", "1 | \n", "1 | \n", "
| 118 | \n", "1.0 | \n", "2.99 | \n", "0 | \n", "0 | \n", "
| 119 | \n", "1.0 | \n", "3.65 | \n", "0 | \n", "0 | \n", "
120 rows × 4 columns
\n", "| \n", " | Salary | \n", "GPA | \n", "MIS | \n", "Statistics | \n", "
|---|---|---|---|---|
| 0 | \n", "72 | \n", "3.53 | \n", "1 | \n", "0 | \n", "
| 1 | \n", "66 | \n", "2.86 | \n", "1 | \n", "0 | \n", "
| 2 | \n", "72 | \n", "3.69 | \n", "0 | \n", "0 | \n", "
| 3 | \n", "63 | \n", "3.24 | \n", "0 | \n", "0 | \n", "
| 4 | \n", "65 | \n", "3.21 | \n", "0 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 115 | \n", "66 | \n", "3.27 | \n", "0 | \n", "0 | \n", "
| 116 | \n", "63 | \n", "2.86 | \n", "1 | \n", "0 | \n", "
| 117 | \n", "78 | \n", "3.04 | \n", "1 | \n", "1 | \n", "
| 118 | \n", "64 | \n", "2.99 | \n", "0 | \n", "0 | \n", "
| 119 | \n", "66 | \n", "3.65 | \n", "0 | \n", "0 | \n", "
120 rows × 4 columns
\n", "| \n", " | Salary | \n", "GPA | \n", "MIS | \n", "Statistics | \n", "misXStatistics | \n", "misXStatistics1 | \n", "
|---|---|---|---|---|---|---|
| 0 | \n", "72 | \n", "3.53 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| 1 | \n", "66 | \n", "2.86 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| 2 | \n", "72 | \n", "3.69 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| 3 | \n", "63 | \n", "3.24 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| 4 | \n", "65 | \n", "3.21 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 115 | \n", "66 | \n", "3.27 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| 116 | \n", "63 | \n", "2.86 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| 117 | \n", "78 | \n", "3.04 | \n", "1 | \n", "1 | \n", "1 | \n", "1.0 | \n", "
| 118 | \n", "64 | \n", "2.99 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
| 119 | \n", "66 | \n", "3.65 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "
120 rows × 6 columns
\n", "| \n", " | Salary | \n", "GPA | \n", "MIS | \n", "Statistics | \n", "misXStatistics | \n", "misXStatistics1 | \n", "misXGpa | \n", "
|---|---|---|---|---|---|---|---|
| 0 | \n", "72 | \n", "3.53 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "3.53 | \n", "
| 1 | \n", "66 | \n", "2.86 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "2.86 | \n", "
| 2 | \n", "72 | \n", "3.69 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "
| 3 | \n", "63 | \n", "3.24 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "
| 4 | \n", "65 | \n", "3.21 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 115 | \n", "66 | \n", "3.27 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "
| 116 | \n", "63 | \n", "2.86 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "2.86 | \n", "
| 117 | \n", "78 | \n", "3.04 | \n", "1 | \n", "1 | \n", "1 | \n", "1.0 | \n", "3.04 | \n", "
| 118 | \n", "64 | \n", "2.99 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "
| 119 | \n", "66 | \n", "3.65 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "
120 rows × 7 columns
\n", "| \n", " | Salary | \n", "GPA | \n", "MIS | \n", "Statistics | \n", "misXStatistics | \n", "misXStatistics1 | \n", "misXGpa | \n", "statisticsXGpa | \n", "
|---|---|---|---|---|---|---|---|---|
| 0 | \n", "72 | \n", "3.53 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "3.53 | \n", "0.00 | \n", "
| 1 | \n", "66 | \n", "2.86 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "2.86 | \n", "0.00 | \n", "
| 2 | \n", "72 | \n", "3.69 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "0.00 | \n", "
| 3 | \n", "63 | \n", "3.24 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "0.00 | \n", "
| 4 | \n", "65 | \n", "3.21 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "0.00 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 115 | \n", "66 | \n", "3.27 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "0.00 | \n", "
| 116 | \n", "63 | \n", "2.86 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "2.86 | \n", "0.00 | \n", "
| 117 | \n", "78 | \n", "3.04 | \n", "1 | \n", "1 | \n", "1 | \n", "1.0 | \n", "3.04 | \n", "3.04 | \n", "
| 118 | \n", "64 | \n", "2.99 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "0.00 | \n", "
| 119 | \n", "66 | \n", "3.65 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.00 | \n", "0.00 | \n", "
120 rows × 8 columns
\n", "