Rozdział 1.2.1.1
import pandas as pd
wikiPL = "https://pl.wikipedia.org/wiki/Reprezentacja_Polski_w_pi%C5%82ce_no%C5%BCnej"
tables = pd.read_html(wikiPL, header=0)
tab = tables[41]
tab.to_csv('/home/krz/Pulpit/Przewodnik_R1/tab.csv',index=False)
print(tab.head())
## Rok I II III IV V VI VII VIII IX X XI XII Śr.
## 0 1993 – – – – – – – 20.0 22.0 23.0 26.0 28.0 24
## 1 1994 28 24 24 28 27 32 32 32.0 33.0 36.0 33.0 29.0 30
## 2 1995 29 32 32 34 36 29 32 28.0 33.0 27.0 33.0 33.0 32
## 3 1996 35 37 37 40 42 42 50 55.0 56.0 55.0 52.0 53.0 48
## 4 1997 53 56 56 52 57 57 51 53.0 50.0 45.0 47.0 48.0 52
Rozdział 1.2.1.2
import pandas as pd
tab = pd.read_csv('/home/krz/Pulpit/Przewodnik_R1/tab.csv')
tab = tab.apply(pd.to_numeric, args=('coerce',))
tab2 = tab.drop(tab.columns[[13]], axis=1)
data_long = pd.melt(tab2, id_vars=['Rok'],var_name='Miesiac')
data_long['Rok'] = pd.Categorical(data_long.Rok)
data_long.to_csv('/home/krz/Pulpit/Przewodnik_R1/data_long.csv',index=False)
print(data_long.head())
## Rok Miesiac value
## 0 1993 I NaN
## 1 1994 I 28.0
## 2 1995 I 29.0
## 3 1996 I 35.0
## 4 1997 I 53.0
Rozdział 1.2.1.3
import warnings
warnings.filterwarnings("ignore")
from scipy import *
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_long = pd.read_csv('/home/krz/Pulpit/Przewodnik_R1/data_long.csv')
fig = plt.figure(figsize=(8,6))
ax = fig.add_subplot(1,1,1)
sns.boxplot(x="Rok", y="value", data=data_long, color="C0", ax=ax, saturation=0.2)
plt.xticks(rotation=45)
ax.set_xlabel("Data publikacji rankingu")
ax.set_ylabel("Pozycja")
ax.set_title("Pozycja Polski w rankingu FIFA")
plt.tight_layout()
plt.savefig('rys_1.1.png')