pd.to_datetime(arg,errors=“raise”,dayfirst=False,yearfirst=False,utc=None,box=True,format=None,exact=True,unit=None,infer_datetime_format=False,origin=“unix”,cache=False)
arg :指定转换的数据对象,能够是整型、浮点型、字符串、列表、元组、一维数组、Serise、DataFrame和字典
errors :设置出错提醒形式,可选{“ignore”,”raise”,”coercec”},默认值为”raise”,如果转换失败,则给出出错提示信息;”ignore”则不登程出错提示信息;”coercec”在转换过程存在有效工夫值时,主动转为NaT值
dayfirst :指定arg参数转换时的程序,设置为True时,则先转换日期,再转换工夫,默认值为False
yearfirst :值为True时则先转换日期,默认值为False
utc :值为True返回UTC DatetimeIndex,默认值为None
box :默认值为True返回DatetimeIndex或相干索引对象;值为False则返回多维数组
format :字符串,默认值为None,指定字符串工夫转化为工夫时的strftime的格局,相似strftime办法转化为工夫的应用办法
exact :默认值为True示意准确匹配格局,值为False则容许匹配指标字符串中的任何地位
unit :字符串,默认值为”ns”,对转换对象指定工夫单位(D天、s秒、ma毫秒、ns纳秒)
infer_datetime_format :默认值为False,如果为True,且没有给出转换固定格局(format参数),且字符串日期工夫格局确定,则能够进步转换速度
origin :确定日期的开始点,默认值为”unix”,则日期的开始点为1970-01-01,若提供值为Timestamp日期,则以Timestamp的终点日期作为开始点日期
cache :跟单网gendan5.com默认值为False,如果为True,则是用惟一的转换日期缓存来利用日期工夫转换,解析反复的日期字符串时能够进步转换速度
import pandas as pdfrom datetime import datetime
filename = r”D:\data_test.xlsx”
df = pd.read_excel(filename)
print(df.head())print(“=”*30)print(df.info())
name gender birthday start_work income tel email \
0 赵一 男 1989/8/10 2012-09-08 15000 13611011234 zhaoyi@qq.com
1 王二 男 1990/10/2 2014-03-06 12500 13500012234 wanger@163.com
2 张三 女 1987/3/12 2009-01-08 18500 13515273330 zhangsan@qq.com
3 李四 女 1991/8/16 2014-06-04 13000 13923673388 lisi@gmail.com
4 刘五 女 1992/5/24 2014-08-10 8500 17823117890 liuwu@qq.com
other
0 {教育:本科,业余:电子商务,喜好:静止}
1 {教育:大专,业余:汽修,喜好:}
2 {教育:本科,业余:数学,喜好:打篮球}
3 {教育:硕士,业余:统计学,喜好:唱歌}
4 {教育:本科,业余:美术,喜好:}
<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 8 entries, 0 to 7
Data columns (total 8 columns):
# Column Non-Null Count Dtype
0 name 8 non-null object
1 gender 8 non-null object
2 birthday 8 non-null object
3 start_work 8 non-null datetime64[ns]
4 income 8 non-null int64
5 tel 8 non-null int64
6 email 8 non-null object
7 other 8 non-null object
dtypes: datetime64ns, int64(2), object(5)
memory usage: 640.0+ bytes
None
df.birthday=pd.to_datetime(df.birthday,format=”%Y-%m-%d”)
df.info()
1
2
<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 8 entries, 0 to 7
Data columns (total 8 columns):
# Column Non-Null Count Dtype
0 name 8 non-null object
1 gender 8 non-null object
2 birthday 8 non-null datetime64[ns]
3 start_work 8 non-null datetime64[ns]
4 income 8 non-null int64
5 tel 8 non-null int64
6 email 8 non-null object
7 other 8 non-null object
dtypes: datetime64ns, int64(2), object(4)
memory usage: 640.0+ bytes
data = pd.DataFrame({“客户”:[“李”,”张”,”刘”,”宋”],”工资”:[3500,2500,1500,500],”日期”:[“2020-11-19″,”2020-11-20″,”2020-12-19″,”2020-12-20”]},index = [“A”,”B”,”C”,”D”])print(data.info)
<bound method DataFrame.info of 客户 工资 日期
A 李 3500 2020-11-19
B 张 2500 2020-11-20
C 刘 1500 2020-12-19
D 宋 500 2020-12-20>
发表回复