pandas基本命令
阿新 • • 發佈:2018-12-10
import pandas
food_info = pandas.read_csv("food_info.csv")
col_names = food_info.columns.tolist()
gram_columns = []
for c in col_names:
if c.endswith("(g)"):
gram_columns.append(c)
print food_info[gram_columns]/10
Water_(g) Protein_(g) Lipid_Tot_(g) Ash_(g) Carbohydrt_(g) \ 0 1.587 0.085 8.111 0.211 0.006 1 1.587 0.085 8.111 0.211 0.006 2 0.024 0.028 9.948 0.000 0.000 3 4.241 2.140 2.874 0.511 0.234 4 4.111 2.324 2.968 0.318 0.279 5 4.842 2.075 2.768 0.270 0.045 6 5.180 1.980 2.426 0.368 0.046 7 3.928 2.518 2.920 0.328 0.306 8 3.710 2.404 3.382 0.371 0.133 9 3.765 2.337 3.060 0.360 0.478 10 3.820 2.376 3.211 0.336 0.257 11 7.979 1.112 0.430 0.141 0.338 12 7.964 1.069 0.385 0.120 0.461 13 8.101 1.034 0.029 0.171 0.666 14 8.124 1.045 0.227 0.127 0.476 15 8.248 1.239 0.102 0.139 0.272 16 5.444 0.593 3.424 0.132 0.407 17 4.156 2.499 2.780 0.422 0.143 18 5.522 1.421 2.128 0.520 0.409 19 3.792 2.560 3.114 0.379 0.155 20 1.344 0.965 2.951 0.475 4.265 21 4.146 2.494 2.744 0.394 0.222 22 3.319 2.981 3.234 0.430 0.036 23 4.842 2.005 2.725 0.379 0.049 24 4.101 2.448 3.028 0.355 0.068 25 5.001 2.217 2.235 0.328 0.219 26 4.838 2.160 2.464 0.291 0.247 27 5.378 2.426 1.592 0.327 0.277 28 4.554 2.458 1.972 0.380 0.636 29 4.177 2.341 3.004 0.366 0.112 ... ... ... ... ... ... 8588 0.200 0.660 0.090 0.200 8.860 8589 7.670 0.100 0.020 0.076 2.134 8590 8.310 0.030 0.020 0.029 1.630 8591 0.130 0.870 1.520 0.185 7.340 8592 0.500 0.712 0.546 0.122 8.119 8593 0.280 1.260 0.950 0.171 7.339 8594 8.160 0.050 0.020 0.052 1.718 8595 5.960 2.840 0.510 0.350 0.340 8596 1.450 0.440 0.750 0.080 7.290 8597 4.990 2.750 1.710 0.240 0.310 8598 2.170 0.000 7.780 0.040 0.030 8599 0.000 0.000 10.000 0.000 0.000 8600 2.390 0.000 0.000 0.000 7.610 8601 5.550 0.408 1.950 0.474 1.618 8602 0.900 1.130 0.210 1.390 6.370 8603 0.420 0.530 0.240 0.990 7.820 8604 8.440 0.000 0.000 0.022 1.538 8605 5.300 0.030 0.003 0.008 4.610 8606 5.466 0.041 0.020 0.035 4.438 8607 2.824 0.008 0.001 0.007 7.160 8608 0.680 1.008 0.300 0.570 7.442 8609 1.040 0.160 0.010 0.186 8.604 8610 0.684 0.081 0.090 0.680 8.466 8611 0.820 7.516 0.185 0.100 1.379 8612 8.190 1.640 0.030 0.140 0.000 8613 4.300 1.850 2.510 1.340 0.000 8614 7.025 2.054 0.084 0.297 0.541 8615 2.600 0.000 0.000 0.086 7.314 8616 7.920 1.610 0.140 0.130 0.200 8617 7.850 1.980 0.050 0.120 0.000 Fiber_TD_(g) Sugar_Tot_(g) FA_Sat_(g) FA_Mono_(g) FA_Poly_(g) 0 0.00 0.006 5.1368 2.1021 0.3043 1 0.00 0.006 5.0489 2.3426 0.3012 2 0.00 0.000 6.1924 2.8732 0.3694 3 0.00 0.050 1.8669 0.7778 0.0800 4 0.00 0.051 1.8764 0.8598 0.0784 5 0.00 0.045 1.7410 0.8013 0.0826 6 0.00 0.046 1.5259 0.7023 0.0724 7 0.00 NaN 1.8584 0.8275 0.0830 8 0.00 0.028 1.9368 0.8428 0.1433 9 0.00 NaN 1.9475 0.8671 0.0870 10 0.00 0.052 2.0218 0.9280 0.0953 11 0.00 0.267 0.1718 0.0778 0.0123 12 0.02 0.238 0.2311 0.1036 0.0124 13 0.00 0.185 0.0169 0.0079 0.0003 14 0.00 0.400 0.1235 0.0516 0.0083 15 0.00 0.272 0.0645 0.0291 0.0031 16 0.00 0.321 1.9292 0.8620 0.1437 17 0.00 0.143 1.7572 0.8125 0.0665 18 0.00 0.409 1.4946 0.4623 0.0591 19 0.00 0.155 1.9196 0.8687 0.1654 20 0.00 NaN 1.9160 0.7879 0.0938 21 0.00 0.222 1.7614 0.7747 0.0657 22 0.00 0.036 1.8913 1.0043 0.1733 23 0.00 0.049 1.6746 0.8606 0.0495 24 0.00 0.050 1.9066 0.8751 0.0899 25 0.00 0.103 1.3152 0.6573 0.0765 26 0.00 0.101 1.5561 0.7027 0.0778 27 0.00 0.113 1.0114 0.4510 0.0472 28 0.00 0.224 1.1473 0.5104 0.0861 29 0.00 0.112 1.9113 0.8711 0.0661 ... ... ... ... ... ... 8588 0.26 0.135 0.0185 0.0252 0.0231 8589 0.16 1.136 0.0072 0.0028 0.0041 8590 0.10 1.466 0.0058 0.0018 0.0047 8591 0.57 0.053 0.2837 0.6341 0.5024 8592 0.42 1.979 0.0600 0.2831 0.1307 8593 1.42 0.054 0.1415 0.4085 0.3572 8594 0.20 1.487 0.0030 0.0025 0.0068 8595 0.00 0.133 0.3304 0.1351 0.0180 8596 0.21 3.510 0.1500 0.5000 0.0900 8597 0.00 0.123 1.0867 0.4844 0.0509 8598 0.00 0.030 1.0784 1.8026 4.5539 8599 0.00 0.000 1.4367 4.8033 3.3033 8600 0.01 7.600 0.0000 0.0000 0.0000 8601 0.00 0.821 0.7996 0.3108 0.7536 8602 2.78 3.590 0.0555 0.0405 0.1035 8603 0.61 0.070 0.0984 0.1154 0.0131 8604 0.01 NaN 0.0000 0.0000 0.0000 8605 0.08 4.530 0.0009 0.0001 0.0008 8606 0.26 3.775 0.0000 0.0000 0.0000 8607 0.00 2.453 0.0003 0.0001 0.0009 8608 1.01 0.070 0.1578 0.1150 0.0130 8609 0.09 0.290 0.0018 0.0032 0.0050 8610 0.08 0.090 0.0099 0.0116 0.0433 8611 0.06 0.000 0.0272 0.0156 0.0810 8612 0.00 0.000 0.0076 0.0053 0.0102 8613 0.00 0.000 0.7148 0.8320 0.6210 8614 0.00 0.000 0.0218 0.0082 0.0222 8615 0.00 7.320 0.0000 0.0000 0.0000 8616 0.00 0.000 0.0361 0.0259 0.0252 8617 0.00 0.000 0.0127 0.0088 0.0170 [8618 rows x 10 columns]
titanic_train = pandas.read_csv("titanic_train.csv")
age = titanic_train["Age"]
age_is_null = pandas.isnull(age)
numb = age[age_is_null]
print len(numb)
177
good_ages = (titanic_train["Age"][age_is_null==False])
correct_mean_age = sum(good_ages)/len(good_ages)
print correct_mean_age
29.6991176471
good_ages.mean()
29.69911764705882
titanic_train.pivot_table(index="Pclass",values="Age")
Age | |
---|---|
Pclass | |
1 | 38.233441 |
2 | 29.877630 |
3 | 25.140620 |