1. 程式人生 > >pandas基本命令

pandas基本命令

import pandas
food_info = pandas.read_csv("food_info.csv")
col_names = food_info.columns.tolist()
gram_columns = []
for c in col_names: 
    if c.endswith("(g)"):
         gram_columns.append(c)         
print food_info[gram_columns]/10
      Water_(g)  Protein_(g)  Lipid_Tot_(g)  Ash_(g)  Carbohydrt_(g)  \
0         1.587        0.085          8.111    0.211           0.006   
1         1.587        0.085          8.111    0.211           0.006   
2         0.024        0.028          9.948    0.000           0.000   
3         4.241        2.140          2.874    0.511           0.234   
4         4.111        2.324          2.968    0.318           0.279   
5         4.842        2.075          2.768    0.270           0.045   
6         5.180        1.980          2.426    0.368           0.046   
7         3.928        2.518          2.920    0.328           0.306   
8         3.710        2.404          3.382    0.371           0.133   
9         3.765        2.337          3.060    0.360           0.478   
10        3.820        2.376          3.211    0.336           0.257   
11        7.979        1.112          0.430    0.141           0.338   
12        7.964        1.069          0.385    0.120           0.461   
13        8.101        1.034          0.029    0.171           0.666   
14        8.124        1.045          0.227    0.127           0.476   
15        8.248        1.239          0.102    0.139           0.272   
16        5.444        0.593          3.424    0.132           0.407   
17        4.156        2.499          2.780    0.422           0.143   
18        5.522        1.421          2.128    0.520           0.409   
19        3.792        2.560          3.114    0.379           0.155   
20        1.344        0.965          2.951    0.475           4.265   
21        4.146        2.494          2.744    0.394           0.222   
22        3.319        2.981          3.234    0.430           0.036   
23        4.842        2.005          2.725    0.379           0.049   
24        4.101        2.448          3.028    0.355           0.068   
25        5.001        2.217          2.235    0.328           0.219   
26        4.838        2.160          2.464    0.291           0.247   
27        5.378        2.426          1.592    0.327           0.277   
28        4.554        2.458          1.972    0.380           0.636   
29        4.177        2.341          3.004    0.366           0.112   
...         ...          ...            ...      ...             ...   
8588      0.200        0.660          0.090    0.200           8.860   
8589      7.670        0.100          0.020    0.076           2.134   
8590      8.310        0.030          0.020    0.029           1.630   
8591      0.130        0.870          1.520    0.185           7.340   
8592      0.500        0.712          0.546    0.122           8.119   
8593      0.280        1.260          0.950    0.171           7.339   
8594      8.160        0.050          0.020    0.052           1.718   
8595      5.960        2.840          0.510    0.350           0.340   
8596      1.450        0.440          0.750    0.080           7.290   
8597      4.990        2.750          1.710    0.240           0.310   
8598      2.170        0.000          7.780    0.040           0.030   
8599      0.000        0.000         10.000    0.000           0.000   
8600      2.390        0.000          0.000    0.000           7.610   
8601      5.550        0.408          1.950    0.474           1.618   
8602      0.900        1.130          0.210    1.390           6.370   
8603      0.420        0.530          0.240    0.990           7.820   
8604      8.440        0.000          0.000    0.022           1.538   
8605      5.300        0.030          0.003    0.008           4.610   
8606      5.466        0.041          0.020    0.035           4.438   
8607      2.824        0.008          0.001    0.007           7.160   
8608      0.680        1.008          0.300    0.570           7.442   
8609      1.040        0.160          0.010    0.186           8.604   
8610      0.684        0.081          0.090    0.680           8.466   
8611      0.820        7.516          0.185    0.100           1.379   
8612      8.190        1.640          0.030    0.140           0.000   
8613      4.300        1.850          2.510    1.340           0.000   
8614      7.025        2.054          0.084    0.297           0.541   
8615      2.600        0.000          0.000    0.086           7.314   
8616      7.920        1.610          0.140    0.130           0.200   
8617      7.850        1.980          0.050    0.120           0.000   

      Fiber_TD_(g)  Sugar_Tot_(g)  FA_Sat_(g)  FA_Mono_(g)  FA_Poly_(g)  
0             0.00          0.006      5.1368       2.1021       0.3043  
1             0.00          0.006      5.0489       2.3426       0.3012  
2             0.00          0.000      6.1924       2.8732       0.3694  
3             0.00          0.050      1.8669       0.7778       0.0800  
4             0.00          0.051      1.8764       0.8598       0.0784  
5             0.00          0.045      1.7410       0.8013       0.0826  
6             0.00          0.046      1.5259       0.7023       0.0724  
7             0.00            NaN      1.8584       0.8275       0.0830  
8             0.00          0.028      1.9368       0.8428       0.1433  
9             0.00            NaN      1.9475       0.8671       0.0870  
10            0.00          0.052      2.0218       0.9280       0.0953  
11            0.00          0.267      0.1718       0.0778       0.0123  
12            0.02          0.238      0.2311       0.1036       0.0124  
13            0.00          0.185      0.0169       0.0079       0.0003  
14            0.00          0.400      0.1235       0.0516       0.0083  
15            0.00          0.272      0.0645       0.0291       0.0031  
16            0.00          0.321      1.9292       0.8620       0.1437  
17            0.00          0.143      1.7572       0.8125       0.0665  
18            0.00          0.409      1.4946       0.4623       0.0591  
19            0.00          0.155      1.9196       0.8687       0.1654  
20            0.00            NaN      1.9160       0.7879       0.0938  
21            0.00          0.222      1.7614       0.7747       0.0657  
22            0.00          0.036      1.8913       1.0043       0.1733  
23            0.00          0.049      1.6746       0.8606       0.0495  
24            0.00          0.050      1.9066       0.8751       0.0899  
25            0.00          0.103      1.3152       0.6573       0.0765  
26            0.00          0.101      1.5561       0.7027       0.0778  
27            0.00          0.113      1.0114       0.4510       0.0472  
28            0.00          0.224      1.1473       0.5104       0.0861  
29            0.00          0.112      1.9113       0.8711       0.0661  
...            ...            ...         ...          ...          ...  
8588          0.26          0.135      0.0185       0.0252       0.0231  
8589          0.16          1.136      0.0072       0.0028       0.0041  
8590          0.10          1.466      0.0058       0.0018       0.0047  
8591          0.57          0.053      0.2837       0.6341       0.5024  
8592          0.42          1.979      0.0600       0.2831       0.1307  
8593          1.42          0.054      0.1415       0.4085       0.3572  
8594          0.20          1.487      0.0030       0.0025       0.0068  
8595          0.00          0.133      0.3304       0.1351       0.0180  
8596          0.21          3.510      0.1500       0.5000       0.0900  
8597          0.00          0.123      1.0867       0.4844       0.0509  
8598          0.00          0.030      1.0784       1.8026       4.5539  
8599          0.00          0.000      1.4367       4.8033       3.3033  
8600          0.01          7.600      0.0000       0.0000       0.0000  
8601          0.00          0.821      0.7996       0.3108       0.7536  
8602          2.78          3.590      0.0555       0.0405       0.1035  
8603          0.61          0.070      0.0984       0.1154       0.0131  
8604          0.01            NaN      0.0000       0.0000       0.0000  
8605          0.08          4.530      0.0009       0.0001       0.0008  
8606          0.26          3.775      0.0000       0.0000       0.0000  
8607          0.00          2.453      0.0003       0.0001       0.0009  
8608          1.01          0.070      0.1578       0.1150       0.0130  
8609          0.09          0.290      0.0018       0.0032       0.0050  
8610          0.08          0.090      0.0099       0.0116       0.0433  
8611          0.06          0.000      0.0272       0.0156       0.0810  
8612          0.00          0.000      0.0076       0.0053       0.0102  
8613          0.00          0.000      0.7148       0.8320       0.6210  
8614          0.00          0.000      0.0218       0.0082       0.0222  
8615          0.00          7.320      0.0000       0.0000       0.0000  
8616          0.00          0.000      0.0361       0.0259       0.0252  
8617          0.00          0.000      0.0127       0.0088       0.0170  

[8618 rows x 10 columns]
titanic_train = pandas.read_csv("titanic_train.csv")
age = titanic_train["Age"]
age_is_null = pandas.isnull(age)
numb = age[age_is_null]
print len(numb)
177
good_ages = (titanic_train["Age"][age_is_null==False])
correct_mean_age = sum(good_ages)/len(good_ages)
print correct_mean_age
29.6991176471
good_ages.mean()
29.69911764705882
titanic_train.pivot_table(index="Pclass",values="Age")
Age
Pclass
1 38.233441
2 29.877630
3 25.140620