exercises
This commit is contained in:
315
YZM526/ex01-python_ve_istatistik.ipynb
Normal file
315
YZM526/ex01-python_ve_istatistik.ipynb
Normal file
@@ -0,0 +1,315 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"metadata": {
|
||||
"collapsed": true
|
||||
},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "0.0"
|
||||
},
|
||||
"execution_count": 2,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"import scipy.stats as st\n",
|
||||
"\n",
|
||||
"# ortalamsı 0, std.spaması 10 olan bir rastegle değişken tanımlayalım\n",
|
||||
"n = st.norm(0, 10)\n",
|
||||
"\n",
|
||||
"n.mean()"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 3,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "10.0"
|
||||
},
|
||||
"execution_count": 3,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"n.std()"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 4,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "30000.0"
|
||||
},
|
||||
"execution_count": 4,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"n.moment(4)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 6,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "0.03989422804014327"
|
||||
},
|
||||
"execution_count": 6,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# rvs : random variates\n",
|
||||
"# pdf : probability density function\n",
|
||||
"# cdf : cumulative distribution func\n",
|
||||
"# sf : survival func (1 - cdf)\n",
|
||||
"# ppf : percent point func (inverse of sf)\n",
|
||||
"# isf : inverse survival func\n",
|
||||
"\n",
|
||||
"n.pdf(0)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 7,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "0.5"
|
||||
},
|
||||
"execution_count": 7,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"n.cdf(0)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 8,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "array([14.47370202, -3.16015903, 10.71787186, 5.92254866, -0.93282238,\n -0.27714311, -8.24859593, -1.01334594, 3.70286296, 11.99284959])"
|
||||
},
|
||||
"execution_count": 8,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Rastgele örneklem oluşturalım. Bu örneklemin ortalaması 0, std. sapması 10 olacaktır\n",
|
||||
"n.rvs(10)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 17,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "(0.0, 0.0, 100.0)"
|
||||
},
|
||||
"execution_count": 17,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"n.mean(), n.median(), n.var()"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 32,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "ShapiroResult(statistic=0.9902140498161316, pvalue=0.6819034218788147)"
|
||||
},
|
||||
"execution_count": 32,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Shapiro-Wilks testi, verilerin normal bir dağılımdan alındığına dair yokluk hipotezini test eder\n",
|
||||
"\n",
|
||||
"st.shapiro(n.rvs(100))"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"from sympy import stats, sqrt,exp, pi\n",
|
||||
"\n",
|
||||
"X = stats.Normal('x', 0, 10)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 3,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "sqrt(2)*exp(-x**2/200)/(20*sqrt(pi))",
|
||||
"text/latex": "$\\displaystyle \\frac{\\sqrt{2} e^{- \\frac{x^{2}}{200}}}{20 \\sqrt{\\pi}}$"
|
||||
},
|
||||
"execution_count": 3,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# X rastgele değişkeninin olasılık yoğunluk fonksiyonu\n",
|
||||
"from sympy.abc import x\n",
|
||||
"stats.density(X)(x)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 4,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "1/2",
|
||||
"text/latex": "$\\displaystyle \\frac{1}{2}$"
|
||||
},
|
||||
"execution_count": 4,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Toplam dağılım fonksiyonun bir noktadaki değeri\n",
|
||||
"stats.cdf(X)(0)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 5,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "1/2",
|
||||
"text/latex": "$\\displaystyle \\frac{1}{2}$"
|
||||
},
|
||||
"execution_count": 5,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Standart olasılık sorularını cevaplamak için sezgisel yol kullanımı\n",
|
||||
"stats.P(X>0)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"# Standart olasılık sorularını cevaplamak için sezgisel yol kullanımı\n",
|
||||
"stats.P(X>0)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"# Beklenen değerler\n",
|
||||
"stats.E(abs(X) ** (1 / 2)).evalf()"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"Diğer python istatistik modülleri\n",
|
||||
"* Seaborn: Keşifçi veri analizi (EDA Explatory Data Analysis) için kullanılır\n",
|
||||
"* Statsmodel: Çok çeşitli istiksel modeller için tanımlayıcı istatistikler, tahminler ve çıkarımlar ile SciPy'ı tamamlamak üzere tasarlanmıştır. Statsmodel ayrıca ekonometrik veri ve problemlere vurgu yaparak zaman serisi analizi için yöntemler ve genelleştirilmiş doğrusal modeller de içerir."
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "Python 3",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 2
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython2",
|
||||
"version": "2.7.6"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 0
|
||||
}
|
||||
420
YZM526/ex02-konum_ve_degiskenlik_olculeri.ipynb
Normal file
420
YZM526/ex02-konum_ve_degiskenlik_olculeri.ipynb
Normal file
@@ -0,0 +1,420 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# Konum Ölçüleri\n",
|
||||
"Konum ölçüleri, analiste verinin merkezinin veya başka nir konumun bulunduğu yerin nicel değerini elde etmeye yarar."
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 10,
|
||||
"metadata": {
|
||||
"collapsed": true
|
||||
},
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"[10, 13, 14, 15, 17, 19, 20, 22, 24, 35, 39, 40, 43, 53, 53, 54, 55, 78, 81, 82, 82, 83, 86, 87, 90, 92, 94, 96, 99, 99]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"import random\n",
|
||||
"import datetime\n",
|
||||
"\n",
|
||||
"sd = datetime.datetime.timestamp(datetime.datetime.now()) * 1000\n",
|
||||
"random.seed(sd)\n",
|
||||
"\n",
|
||||
"veri = [random.randint(10, 100) for _ in range(30)]\n",
|
||||
"veri.sort()\n",
|
||||
"\n",
|
||||
"print(veri)"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 11,
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"veri = [10, 14, 14, 17, 21, 21, 24, 27, 28, 30, 33, 35, 38, 41, 41, 42, 49, 51, 53, 54, 54, 60, 62, 71, 74, 76, 77, 77,\n",
|
||||
" 79, 87]"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 12,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "45.333333333333336"
|
||||
},
|
||||
"execution_count": 12,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Ortalama\n",
|
||||
"import statistics\n",
|
||||
"\n",
|
||||
"statistics.mean(veri)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 13,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "41.5"
|
||||
},
|
||||
"execution_count": 13,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Medyan\n",
|
||||
"# Örneklemin merkezi eğilimini aşırı (aykurı) değerlerden etkilenmeyecek şekilde yansıtmaktır.\n",
|
||||
"# Öncelikle küçükten, büyüğe sıralama\n",
|
||||
"# n tek ise -> ortadaki gözlem\n",
|
||||
"# n çit ise -> ortadaki iki gözlemin aritmatik ırtalması\n",
|
||||
"\n",
|
||||
"statistics.median(veri)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 14,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "[14, 21, 41, 54, 77]"
|
||||
},
|
||||
"execution_count": 14,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Mod: tepe noktası. En çok tekrarlayan değer\n",
|
||||
"statistics.multimode(veri)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 15,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "[26.25, 41.5, 64.25]"
|
||||
},
|
||||
"execution_count": 15,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Çeyrekler / Kartiller / Quartiles\n",
|
||||
"# Q1: en küçük %25 i ayıran değer = .25 * (n+1) inci değer\n",
|
||||
"# Q2: en küçük %50 yi ayıran değer = medyan = .50 * (n+1)\n",
|
||||
"# Q3: en küçük %75 i ayıran değer = .75 * (n + 1)\n",
|
||||
"\n",
|
||||
"# Nasıl hesaplıyoruz\n",
|
||||
"# örneğin veride 12 rakam var\n",
|
||||
"# bu durumda .25 * (12 + 1) = 3.25 inci değeri bulmalız\n",
|
||||
"# varsayalım 3. değer : 65, 4. değer ise 67 olsun\n",
|
||||
"# Q1 = 65 + .25 * (67-65) = 65.5 olacaktır\n",
|
||||
"\n",
|
||||
"statistics.quantiles(veri)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"Bir örneklemin beş sayılı özeti\n",
|
||||
"* min\n",
|
||||
"* Q1\n",
|
||||
"* Q2\n",
|
||||
"* Q3\n",
|
||||
"* max"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 52,
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"Ortalama: 73.17 :: Medyan 73.5 :: 5 Sayılı Özet: 60 65.5 73.5 81.5 85\n",
|
||||
"Ortalama: 144.46 :: Medyan 75 :: 5 Sayılı Özet: 60 66.0 75.0 83.0 1000\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"veriSeti = [60, 63, 65, 67, 70, 72, 75, 75, 80, 82, 84, 85]\n",
|
||||
"\n",
|
||||
"qs = statistics.quantiles(veriSeti)\n",
|
||||
"med = statistics.median(veriSeti)\n",
|
||||
"print(\"Ortalama: \", round(statistics.mean(veriSeti), 2),\n",
|
||||
" \" :: Medyan\", med,\n",
|
||||
" \" :: 5 Sayılı Özet:\", veriSeti[0], qs[0], qs[1], qs[2], veriSeti[-1])\n",
|
||||
"\n",
|
||||
"# Veriye extrem bir değer / aykırı bir gözlem ekleyelim\n",
|
||||
"veriSetiExtrem = [60, 63, 65, 67, 70, 72, 75, 75, 80, 82, 84, 85, 1000]\n",
|
||||
"qs = statistics.quantiles(veriSetiExtrem)\n",
|
||||
"med = statistics.median(veriSetiExtrem)\n",
|
||||
"print(\"Ortalama: \", round(statistics.mean(veriSetiExtrem), 2),\n",
|
||||
" \" :: Medyan\", med,\n",
|
||||
" \" :: 5 Sayılı Özet:\", veriSetiExtrem[0], qs[0], qs[1], qs[2], veriSetiExtrem[-1])"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 45,
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"# standard numpy and matplotlib library imports\n",
|
||||
"import numpy as np\n",
|
||||
"import matplotlib.pyplot as plt\n",
|
||||
"\n",
|
||||
"def dotplot(input_x, **args):\n",
|
||||
" # Count how many times does each value occur\n",
|
||||
" unique_values, counts = np.unique(input_x, return_counts=True)\n",
|
||||
"\n",
|
||||
" # Convert 1D input into 2D array\n",
|
||||
" scatter_x = [] # x values\n",
|
||||
" scatter_y = [] # corresponding y values\n",
|
||||
" for idx, value in enumerate(unique_values):\n",
|
||||
" for counter in range(1, counts[idx]+1):\n",
|
||||
" scatter_x.append(value)\n",
|
||||
" scatter_y.append(counter)\n",
|
||||
"\n",
|
||||
" # draw dot plot using scatter()\n",
|
||||
" plt.scatter(scatter_x, scatter_y, **args)\n",
|
||||
"\n",
|
||||
" # Optional - show all unique values on x-axis.\n",
|
||||
" # Matplotlib might hide some of them\n",
|
||||
" plt.gca().set_xticks(unique_values)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 30,
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"Nitrojen Yok Ortalama, Mod, Medyan 0.399 0.4 0.43\n",
|
||||
"Nitrojen Var Ortalama, Mod, Medyan 0.565 0.505 0.26\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"nitrojen_yok = [.32, .53, .28, .37, .47, .43, .36, .42, .38, .43]\n",
|
||||
"nitrojen_var = [.26, .43, .47, .49, .52, .75, .79, .86, .62, .46]\n",
|
||||
"\n",
|
||||
"print(\"Nitrojen Yok Ortalama, Mod, Medyan\", statistics.mean(nitrojen_yok), statistics.median(nitrojen_yok), statistics.mode(nitrojen_yok))\n",
|
||||
"print(\"Nitrojen Var Ortalama, Mod, Medyan\", statistics.mean(nitrojen_var), statistics.median(nitrojen_var), statistics.mode(nitrojen_var))"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"Her iki veri setinin de mod, medyan ve ortalama değerleri çok benzer. Bir de görsel olarak bakalım"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 50,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "<Figure size 640x480 with 1 Axes>",
|
||||
"image/png": ""
|
||||
},
|
||||
"metadata": {},
|
||||
"output_type": "display_data"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"dotplot(input_x=nitrojen_yok)\n",
|
||||
"dotplot(input_x=nitrojen_var)\n",
|
||||
"\n",
|
||||
"# Grafikten görüldüğü üzere, nitrojen_var veri setinin değişkenliği nitrojen_yok'tan çok daha fazla."
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# Değişkenlik Ölçüleri (Measures Of Variation)\n",
|
||||
"\n",
|
||||
"Örneklem değişkenliği veri analizinde önemli bir rol oynar.\n",
|
||||
"\n",
|
||||
"Küçük veri analizi problemlerinde bile, belirli bir istatistiksel yöntemin başarısı, örneklemdeki gözlemler arasındaki değişkenliğin büyüklüğüne bağlı olabilir. Bir örneklemdeki konum ölçüleri, bir veri kümesinin uygun bir özetini sağlamayabilir. Örneğin, bir önceki örnekte, örneklem değişkenliğini hesaba katmadan azot kullanımının büyümeyi arttırdığı sonucuna varamayız.\n",
|
||||
"\n",
|
||||
"Pek çok konum ölçüsü olduğu gibi birçok değişkenlik (veya yayılım, saçılım, dağılım) ölçüsü de vardır.\n"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 53,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "25"
|
||||
},
|
||||
"execution_count": 53,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Açıklık (Range)\n",
|
||||
"tmpData = np.array(veriSeti)\n",
|
||||
"tmpData.max() - tmpData.min()"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 54,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "8.0"
|
||||
},
|
||||
"execution_count": 54,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# IQR : Interquartile Range\n",
|
||||
"# IQR, verilerin orta %50’sindeki yayılımı ölçer\n",
|
||||
"qs = statistics.quantiles(veriSeti)\n",
|
||||
"qs[2] - qs[0]"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 56,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "20.3"
|
||||
},
|
||||
"execution_count": 56,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Varyans\n",
|
||||
"# s2 ile gösterilen örneklem varyansı, her gözlem ile örneklem ortalaması (x̄) arasındaki\n",
|
||||
"# farkların karelerinin toplamının örneklem büyüklüğünün bir eksiğine bölünmesiyle elde\n",
|
||||
"# n-1 --> degree of freedom\n",
|
||||
"\n",
|
||||
"statistics.variance([3,0,-2,-1,5,10])"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 58,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "4.51"
|
||||
},
|
||||
"execution_count": 58,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Standart sapma\n",
|
||||
"# s = sqrt(s2)\n",
|
||||
"\n",
|
||||
"round(statistics.stdev([3,0,-2,-1,5,10]), 2)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "Python 3",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 2
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython2",
|
||||
"version": "2.7.6"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 0
|
||||
}
|
||||
308
YZM526/vize.ipynb
Normal file
308
YZM526/vize.ipynb
Normal file
@@ -0,0 +1,308 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# SORU 3"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 1,
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"# Helper functions\n",
|
||||
"def pprint(title, val):\n",
|
||||
" space = (40 - len(title)) * \" \"\n",
|
||||
"\n",
|
||||
" if type(val) == int or type(val) == float:\n",
|
||||
" vs = \"{:.0f}\".format(val)\n",
|
||||
" indent = (5 - len(vs)) * \" \"\n",
|
||||
" else:\n",
|
||||
" indent = \" \"\n",
|
||||
"\n",
|
||||
" if type(val) == list:\n",
|
||||
" tmpVal = val[0]\n",
|
||||
" val = \",\".join([str(elem) for elem in val])\n",
|
||||
" if type(tmpVal) == int or type(tmpVal) == float:\n",
|
||||
" vs = \"{:.0f}\".format(tmpVal)\n",
|
||||
" indent = (5 - len(vs)) * \" \"\n",
|
||||
" else:\n",
|
||||
" indent = (5 - len(val)) * \" \"\n",
|
||||
"\n",
|
||||
" print(title, space, \":\", indent, val)\n",
|
||||
"\n",
|
||||
"def tprint(t):\n",
|
||||
" dash = len(t) * \"-\"\n",
|
||||
" print(t)\n",
|
||||
" print(dash)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"metadata": {
|
||||
"collapsed": true
|
||||
},
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"Verilerin Toplamı : 1350\n",
|
||||
"Ortalama : 45\n",
|
||||
"\n",
|
||||
"Ortalama Farkları\n",
|
||||
"------------------\n",
|
||||
"[-35, -31, -31, -28, -24, -24, -21, -18, -17, -15, -12, -10, -7, -4, -4, -3, 0, 6, 8, 9, 9, 10, 17, 26, 29, 31, 32, 32, 32, 43]\n",
|
||||
"Ortalamadan Farkların Toplamı : 0\n",
|
||||
"\n",
|
||||
"\n",
|
||||
"Ortalama Fark Kareleri\n",
|
||||
"-----------------------\n",
|
||||
"[1225, 961, 961, 784, 576, 576, 441, 324, 289, 225, 144, 100, 49, 16, 16, 9, 0, 36, 64, 81, 81, 100, 289, 676, 841, 961, 1024, 1024, 1024, 1849]\n",
|
||||
"Ortalama Farkların Karesi Toplamı : 14746\n",
|
||||
"\n",
|
||||
"Varyans : 508.48\n",
|
||||
"Std. Sapma : 22.55\n",
|
||||
"Medyan : 41.5\n",
|
||||
"Mod : 77\n",
|
||||
"Çeyreklikler : 26.25,41.5,64.25\n",
|
||||
"Aralık : 78\n",
|
||||
"Çeyreklikler Aralığı : 38.0\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Soru 1-A, C, E\n",
|
||||
"import statistics\n",
|
||||
"\n",
|
||||
"veri = [10, 14, 14, 17, 21, 21, 24, 27, 28, 30, 33, 35, 38, 41, 41, 42, 45, 51, 53, 54, 54, 55, 62, 71, 74, 76, 77, 77, 77, 88]\n",
|
||||
"pprint(\"Verilerin Toplamı\", sum(veri))\n",
|
||||
"\n",
|
||||
"mean = statistics.mean(veri)\n",
|
||||
"pprint(\"Ortalama\", statistics.mean(veri))\n",
|
||||
"\n",
|
||||
"ortFark = [(x - mean) for x in veri]\n",
|
||||
"tprint(\"\\nOrtalama Farkları\")\n",
|
||||
"print(ortFark)\n",
|
||||
"pprint(\"Ortalamadan Farkların Toplamı\", sum(ortFark))\n",
|
||||
"print()\n",
|
||||
"\n",
|
||||
"ortFarkKare = [(x - mean)**2 for x in veri]\n",
|
||||
"tprint(\"\\nOrtalama Fark Kareleri\")\n",
|
||||
"print(ortFarkKare)\n",
|
||||
"pprint(\"Ortalama Farkların Karesi Toplamı\", sum(ortFarkKare))\n",
|
||||
"\n",
|
||||
"print()\n",
|
||||
"\n",
|
||||
"pprint(\"Varyans\", round(statistics.variance(veri), 2))\n",
|
||||
"pprint(\"Std. Sapma\", round(statistics.stdev(veri), 2))\n",
|
||||
"pprint(\"Medyan\", statistics.median(veri))\n",
|
||||
"pprint(\"Mod\", statistics.multimode(veri))\n",
|
||||
"\n",
|
||||
"qs = statistics.quantiles(veri)\n",
|
||||
"pprint(\"Çeyreklikler\", qs)\n",
|
||||
"\n",
|
||||
"pprint(\"Aralık\", veri[-1] - veri[0])\n",
|
||||
"pprint(\"Çeyreklikler Aralığı\", qs[2]-qs[0])"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 3,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "(<Figure size 750x275 with 1 Axes>, <Axes: >)"
|
||||
},
|
||||
"execution_count": 3,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
},
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "<Figure size 750x275 with 1 Axes>",
|
||||
"image/png": ""
|
||||
},
|
||||
"metadata": {},
|
||||
"output_type": "display_data"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Soru 1-B\n",
|
||||
"# Dal - yaprak grafiği\n",
|
||||
"import stemgraphic\n",
|
||||
"stemgraphic.stem_graphic(veri, asc=False)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 4,
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"Çarpıklık Katsayısı : 0.24165031687153363\n",
|
||||
"Çarpıklık Yönü : Sağ\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Soru 1-D\n",
|
||||
"# Çarpıklık\n",
|
||||
"from scipy.stats import skew\n",
|
||||
"sk = skew(veri)\n",
|
||||
"if sk > 0:\n",
|
||||
" yon = \"Sağ\"\n",
|
||||
"elif sk < 0:\n",
|
||||
" yon = \"Sol\"\n",
|
||||
"else:\n",
|
||||
" yon = \"Simetrik\"\n",
|
||||
"pprint(\"Çarpıklık Katsayısı\", sk)\n",
|
||||
"pprint(\"Çarpıklık Yönü\", yon)"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 21,
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
" Frekans 0\n",
|
||||
"0 \n",
|
||||
"[10, 24) 6\n",
|
||||
"[24, 38) 6\n",
|
||||
"[38, 52) 6\n",
|
||||
"[52, 66) 5\n",
|
||||
"[66, 80) 6\n",
|
||||
"[80, 94) 1\n"
|
||||
]
|
||||
},
|
||||
{
|
||||
"data": {
|
||||
"text/plain": " Frekans 0\n0 \n[10, 24) 6\n[24, 38) 6\n[38, 52) 6\n[52, 66) 5\n[66, 80) 6\n[80, 94) 1",
|
||||
"text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>Frekans 0</th>\n </tr>\n <tr>\n <th>0</th>\n <th></th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>[10, 24)</th>\n <td>6</td>\n </tr>\n <tr>\n <th>[24, 38)</th>\n <td>6</td>\n </tr>\n <tr>\n <th>[38, 52)</th>\n <td>6</td>\n </tr>\n <tr>\n <th>[52, 66)</th>\n <td>5</td>\n </tr>\n <tr>\n <th>[66, 80)</th>\n <td>6</td>\n </tr>\n <tr>\n <th>[80, 94)</th>\n <td>1</td>\n </tr>\n </tbody>\n</table>\n</div>"
|
||||
},
|
||||
"execution_count": 21,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Soru 1-F\n",
|
||||
"import pandas as pd\n",
|
||||
"import numpy as np\n",
|
||||
"\n",
|
||||
"w = 14\n",
|
||||
"binEdges = [int(x) for x in range(min(veri), max(veri)+w, w)]\n",
|
||||
"\n",
|
||||
"df = pd.DataFrame(veri)\n",
|
||||
"res = df.apply(lambda x: pd.cut(x, bins=binEdges, right=False).value_counts()).sort_index().add_prefix('Frekans ')\n",
|
||||
"print(res)\n",
|
||||
"#res"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 15,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "(array([6., 6., 6., 5., 6., 1.]),\n array([10., 24., 38., 52., 66., 80., 94.]),\n <BarContainer object of 6 artists>)"
|
||||
},
|
||||
"execution_count": 15,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
},
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "<Figure size 640x480 with 1 Axes>",
|
||||
"image/png": ""
|
||||
},
|
||||
"metadata": {},
|
||||
"output_type": "display_data"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Soru 1-G / Histogram\n",
|
||||
"import matplotlib.pyplot as plt\n",
|
||||
"\n",
|
||||
"plt.hist(veri, bins=binEdges, edgecolor='black')"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 7,
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "[<matplotlib.lines.Line2D at 0x7fd6f683d990>]"
|
||||
},
|
||||
"execution_count": 7,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
},
|
||||
{
|
||||
"data": {
|
||||
"text/plain": "<Figure size 640x480 with 1 Axes>",
|
||||
"image/png": ""
|
||||
},
|
||||
"metadata": {},
|
||||
"output_type": "display_data"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Soru 1-G / Ogive\n",
|
||||
"values, base = np.histogram(veri, binEdges)\n",
|
||||
"kum = np.cumsum(values)\n",
|
||||
"plt.plot(base[1:], kum, marker=\"o\", linestyle='-')"
|
||||
],
|
||||
"metadata": {
|
||||
"collapsed": false
|
||||
}
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "Python 3",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 2
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython2",
|
||||
"version": "2.7.6"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 0
|
||||
}
|
||||
Reference in New Issue
Block a user