排序
sort_values()方法可以使series的值按照升序排序。
s1.sort_values()
b 1c 2a 4d 9dtype: int64
求中位数
median()方法可以直接得到序列的中位数,在此之上可以进行比较等操作。
print(s1)print("中位数为:", s1.median())print("大于序列中位数的数\n",s1[s1 > s1.median()])
0 61 12 23 9dtype: int64中位数为: 4.0大于序列中位数的数0 63 9dtype: int64
运算
两个series之间的运算,可加减乘除(必须保证index是一致的)。
s2 = pd.Series([4, 3, 5, 8],index=['a','b','c','d'])s2+s1
a 8b 4c 7d 17dtype: int64
时间序列
pandas包中的data_range()方法可以生产时间序列,便于进行数据的处理。
s3=pd.Series([100, 150, 200])print("产生的序列是:\n",s3)idx=pd.date_range(start='2019-9',freq='M',periods=3)print("\n生成的时间序列是:\n",idx)s3.index=idxprint("\n产生的时间序列是:\n",s3)
产生的序列是:0 1001 1502 200dtype: int64生成的时间序列是:DatetimeIndex(['2019-09-30', '2019-10-31', '2019-11-30'], dtype='datetime64[ns]', freq='M')产生的时间序列是:2019-09-30 1002019-10-31 1502019-11-30 200Freq: M, dtype: int64
类型转换
转DataFrame
dfFromSeries=s2.to_frame()print("Series转DataFrame\n",dfFromSeries)print("显示数据结构类型:",type(dfFromSeries))
Series转DataFrame0a 4b 3c 5d 8显示数据结构类型: <class 'pandas.core.frame.DataFrame'>
转Dict
dictFromSeries=s2.to_dict()print("Series转Dict\n",dictFromSeries)print("显示数据结构类型:",type(dictFromSeries))
Series转Dict{'a': 4, 'b': 3, 'c': 5, 'd': 8}显示数据结构类型: <class 'dict'>
