点击上方"中软国际教育科技集团"
关于数据应用开发与服务(Python)
职业技能等级证书(中级/高级)师资培训工作的通知(第十期)
一、培训目标
01
围绕数据应用开发与服务(Python)职业技能等级标准,提升试点校教师以及企业教师的专业知识以及实践能力,选拔一批优秀教师加入《中软国际1+X证书讲师库》,并颁发“中软国际1+X证书特聘培训讲师”证书。
02
提供对1+X证书制度、证书标准、考核大纲、培训与考核要求的理解,理解本证书“书证融通”方案设计方法,提升相关专业人才培养和课程改革水平,掌握本证书标准技能重点、难点,逐步实现“课证双向融通”,提升教学质量和学生培养质量。
03
精准掌握证书标准和考核大纲要求,提高组织培训与考核能力,明确技术平台要求及考核要点,充分熟悉评分流程和要求,科学把握评判标准等,逐步建立一支能支撑本证书考核,能很好推广1+X证书制度试点内涵要义的高素质考核评价团队,保障证书考核评价质量,建设一支符合1+X证书制度试点要求的高水平教师队伍。
二、培训对象
01
(9:00-17:00)
02
培训地点
北京信息职业技术学院
(北京市朝阳区芳园西路5号)
03
04
四、培训内容
培训主题
培训内容
第一天
证书说明
(1)证书等级和覆盖内容
(2)考核方式和样题介绍
(3)中、高级技能标准详解
使用多线程实现多任务并发
(1)创建线程
(2)线程同步的基本方法
(3)使用线程队列Queue
基于网络应用协议获取数据
(2)通过ftp协议获取文件服务器目录,下载文件
(4)使用json解析网页数据
使用爬虫框架爬取网站数据
(1)安装和创建scrapy项目
(3)解析HTML标签
(4)设置输出管道(控制台输出、文件输出)
(5)设置翻页功能
(6)实现自动链接跳转
非结构化数据采集
(1)读写MongoDB非结构化数据
(2)读写Redis非结构化数据
项目作业
综合使用爬虫、关系型数据库和非结构化数据库爬取、提取和存储数据
第二天
获取数据分布特点及可视化展现
(3)通过饼图、柱状图等展现数据的分布情况
(4)通过直方图、箱图和误差图等展现数据的分布情况
对数据进行归一化处理
(1)Min-Max归一化处理
(2)标准差归一化处理
对文本数据进行数值化处理
(1)使用LabelEncoder
(3)使用OrdinalEncoder
(4)使用Onehot编码:OneHotEncoder
对数据进行离散化和分箱处理
(2)使用KBinsDiscretizer
检测数据中的异常点或离群点
(1)Z-score方法
(2)IQR方法
项目作业
读取数据文件,按照要求进行数据预处理,检测异常值,并进行可视化分析
第三天
训练和验证线性回归模型
(1)使用LinearRegression训练模型
(2)使用SGDRegressor训练模型
(3)计算均方误差(MSE)和R方
训练和验证逻辑回归模型
(1)使用LogisticRegression训练模型
(2)调整模型的超参数
(3)计算TP、FP、TN、FN
(4)计算Accuracy、Precision、Recall、F1 Score
使用朴素贝叶斯进行文本分类
(1)构建词袋、计算词频
(2)使用MultinomialNB建模
(3)垃圾短信分类
使用K近邻模型进行分类
(1)计算常见的向量距离:曼哈顿距离、欧式距离、余弦夹角、汉明距离
(2)使用NearestNeighbors训练分类模型
使用KMeans模型进行聚类
(1)使用Kmeans训练聚类模型
(2)以可视化的方式查看聚类效果
使用决策树模型
(1)使用DecisionTreeClassifier训练决策树模型
(2)调整模型的超参数
(3)使用graphviz可视化查看决策树的分枝过程
(4)特征权重计算
(4)使用决策树处理回归问题
项目作业
航空公司客户价值聚类分析
项目作业
决策树构建收入水平分类模型
第四天
使用随机森林模型进行分类
(1)使用随机森林模型处理分类问题
(2)特征权重计算
(3)调整模型的超参数
(4)使用随机森林模型处理回归问题
模型优选
(1)使用GridSearchCV进行超参数优选
(2)绘制ROC曲线
(3)计算AUC
使用Boosting集成学习模型
(1)使用AdaBoost
(2)使用GBDT
(3)使用XGBoost
对数据进行特征降维
(1)主成分分析法:PCA
(2)使用LinearDiscriminantAnalysis
使用Filter方法进行特征筛选
(1)使用交叉验证的性能结果来衡量特征子集的效果:cross_val_score
(2)方差过滤法:VarianceThreshold
(3)卡方过滤法:SelectKBest、Chi2
(4)F检验法:f_classif、f_regression
(5)互信息法:mutual_info_classif
第五天
使用Wrapper和Embedded方法进行特征筛选
(1)使用RFE
(2)使用SelectFromModel
高级建模
(1)构建基于关联规则的推荐模型
(2)构建基于协同过滤的推荐模型
构建Web服务
(1)使用Django构建RESTful服务接口
(2)使用Flask构建RESTful服务接口
(3)模型的保存、装载及推理API
(4)客户端与服务端的联调
项目作业
机器学习端到端建模(心脏病诊断建模)
五、培训费用
01
收费标准
培训费用3800元/人(含食宿)。
主要用于学员食宿费、专家授课、人员差旅、技术支持、教学场地、培训材料等费用支出;参培学员食宿统一安排。
02
收费方式
1.收款单位指定账户
开户名称:
北京中软国际教育科技股份有限公司
开户银行:
北京银行中关村支行
银行账号:
01090302900120105606242
付款请注明“单位名称、培训期次、学员姓名”。
2.支付方式
3.发票开具
由收款单位“北京中软国际教育科技股份有限公司”向培训学员开具“培训费”发票。
六、其他说明
01
报名方式
报名咨询:周洁
培训咨询:李修霖
02
疫情防控
1.请参加培训的学员如实填写“健康承诺书”(见附件2),本人亲笔签名并于报到时携带上交。
2.为做好疫情防控工作,在培训期间请参培学员佩戴好口罩,勤洗手,不要前往人员密集的公共场所,做好自我防护。
03
2.本次培训涵盖数据应用开发与服务(Python)职业技能等级标准的中级、高级内容,培训考核合格后颁发培训结业证书。
3.培训班不设接送站服务,请学员自行前往培训地点。
END
中软国际教育科技集团(简称中软国际教育)是 中软国际 人才生态的重要组成部分。积极与全国各地院校、行业企业展开合作,携手共育产业人才,积极开拓政企人才服务及在线人才服务领域,全面构建IT教育人才生态圈。在20余年的发展历程中,业务领域及服务模式不断推陈出新,始终站在IT人才教育领域的技术和业务变更的前沿位置,聚集云计算、大数据、人工智能、5G物联网、网络安全等新一代信息应用技术领域展开专业IT技术人才培养。致力于为国家、社会、企业、高校提供最专业、全方位的人才培养解决方案。积极探索新时代下产教融合新模式、新思路、新方法,为实现新时代信息技术产业卓越人才培养贡献力量!
共处技术、行业
变革的前沿
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.