课程参数
教学服务
随到随学
随时随地皆可学习,无需等待,使你的学习更灵活,更高效。
学前测试
基本信息调查和基础测试,全面了解学前情况,为你制定更适合的学习内容和方法。
专属学习档案
导师时刻关注学习效果,随时指导修订学习路径,全面记录你的专属学习历程。
班主任督导
班主任全程跟进,提供全方位暖心服务,为你的学习保驾护航。
每周学习反馈
每周反馈你的学习数据,提供针对性的指导,关注你的每一个进步,使学习更有动力。
闯关式学习
进阶式地达成每一个目标,不断提高成就感,稳扎稳打,完成课程。
答疑辅导
答疑解惑,及时扫清学习过程中的障碍,助你顺利完成学习。
作业批改
批改作业,指出问题,发现你的薄弱环节,提出建议,使你更有重心的学习。
全方位学习测评
小节测试、课后练习,阶段作业多维度测评,有效保障你的学习效果。
问答讨论
提供高效便捷的答疑平台,与同伴互相交流和借鉴,提升自己。
大咖分享
业界大牛解读前沿技术及其背后的工作原理,拓宽你的眼界。
配套教辅
高度契合的配套讲义、大纲,保证让你全方位的理解知识。
源码开放
提供全部课程源码,搭建真实的开发环境,保证你的练习更高效。
就业服务
一对一职业规划,就业指导,为你高薪就业保驾护航。
学习报告
记录学习轨迹和学习掌握情况,真实全面地体现你的综合学习成果。
结业证书
以官方名义提供的学习经历和成果证明, 是对你能力的肯定和获得企业认可的敲门砖。
作业点评
讲解作业设计思路、点评学员作业问题并给出最终解决方案
入学须知
帮助你更快速的进入学习状态。
集中答疑
定期收集和解答你的技术问题,助你顺利完成学习。
就业指导
简历指导,面试辅导,帮你解惑面试问题。
课程更新
在服务期内,如果课程有更新,你可以享受更新后的课程内容。

本套课程覆盖“以机器学习技术栈完成数据挖掘任务,以深度学习技术栈完成NLP自然语言处理”等主流领域;并提供综合项目实战让学生真正掌握 “企业级数据挖掘、自然语言处理等解决方案 ”,为了保障学生就业后竞争力的提升,研发多个人工智能CV方向进阶提升项目课程,如:实时人脸识别、人脸支付、智慧交通、多模态项目等。成为全能的企业级人工智能开发人才。

学完收获 :
能够熟练掌握人工智能开发的通用技术和框架,具备人工智能领域内机器学习,深度学习,自然语言处理和计算机视觉业务分析及开发的能力,同时培养学生使用AI算法构建业务流的能力和针对特定算法进行实用化、拓展化的再创新能力,足以胜任算法工程师等相关AI职位。

★ 亮点1
精英教研团
队,高标准支撑
课程升级更新
★ 亮点2
培养懂业务
精技术的人工
智能研发工程师
★ 亮点3
课程设置科学
合理,适合AI
技术初学者
★ 亮点4
制定AI培训
新标准,培养
AI专精人才
阶段一 Python基础
| Python基础语法
变量、标识符和关键字、输入和输出、数据类型转换、PEP8编码规范、比较/关系运算符、if判断语句语法格式、三目运算符、while语句语法格式、while 循环嵌套、break 和 continue、while 循环案例、for循环
| Python数据处理
字符串定义语法格式、字符串遍历、下标和切片、字符串常见操作、列表语法格式、列表的遍历、列表常见操作、列表嵌套、列表推导式、元组语法格式、元组操作、字典语法格式、字典常见操作、字典的遍历
| 函数
函数概念和作用、函数定义、调用、函数的参数、函数的返回值、函数的注释、函数的嵌套调用、可变和不可变类型、局部变量、全局变量、组包和拆包、引用
| 文件读写
文件的打开与关闭、文件的读写、文件、目录操作及案例、os模块文件与目录相关操作
| 异常处理
模块介绍、模块的导入、包的概念、包的导入、模块中的all、模块中name

学完后具备如下能力: 1. 掌握Python开发环境基本配置; 2. 掌握运算符、表达式、流程控制语句、数组等的使用; 3. 掌握字符串的基本操作; 4. 初步建立面向对象的编程思维; 5. 熟悉异常捕获的基本流程及使用方式; 6. 掌握类和对象的基本使用方式。

阶段二 Python编程进阶
| 面向对象
面向对象介绍、类的定义和对象的创建、添加和获取对象属性、self 参数、init方法、继承、子类方法重写、类属性和实例属性、类方法、实例方法、静态方法
| 网络编程
IP地址的介绍、端口和端口号的介绍、TCP的介绍、Socket的介绍、TCP网络应用的开发流程、基于TCP通信程序开发
| 多任务编程
多任务介绍、多进程的使用、多线程的使用、线程同步
| 进阶语法
闭包、装饰器、迭代器、深浅拷贝、正则
| Python编程综合案例
Python编程综合案例

学完后具备如下能力: 1. 掌握网络编程技术,能够实现网络通信; 2. 知道通讯协议原理; 3. 掌握开发中的多任务编程实现方式; 4. 知道多进程多线程的原理。

阶段三 数据处理与统计分析
| Linux
Linux命令使用、Linux命令选项的使用、远程登录和远程拷贝、Linux权限管理、vi编辑器使用、集群搭建准备
| MySQL与SQL
数据库概念和作用、MySQL数据类型、数据完整性和约束、数据库、表基本操作命令、表数据操作命令、where子句、分组聚合、连接查询、外键的使用、Pymysql
| Numpy矩阵运算库
Numpy运算优势、数组的属性、数组的形状、Numpy实现数组基本操作、Numpy实现数组运算、偏导数、极限、矩阵求导、向量、矩阵交换律、矩阵乘法、矩阵求逆、伴随矩阵
| Pandas数据清洗
数据组合:Pandas数据组合concat连接、Pandas数据组合merge数据、Pandas数据组合join;
缺失值处理:缺失值处理介绍、缺失值数量统计、缺失值可视化、删除缺失值、填充缺失值;
整理数据:melt整理数据、widetolong整理数据;
Pandas数据类型:Pandas数据类型简介、数据类型转换、分类数据类型;
apply函数:Series和DataFrame的apply方法、apply使用案例;
| Pandas数据整理
数据分组:单变量分组聚合、通过调用agg进行聚合、分组后transformtransform练习;
Pandas透视表:透视表概述&会员存量增量分析、会员增量等级分布、增量等级占比分析&整体等级分布、线上线下增量分析&地区店均会员数量、会销比计算、连带率计算、复购率计算;
Datetime数据类型:日期时间类型介绍、提取日期分组案例、股票数据处理、datarange函数、综合案例;
| Pandas数据可视化
Matplotlib可视化、Pandas可视化、Seaborn可视化、Pyecharts可视化
| Pandas数据分析项目-RFM客户分群案例
RFM概念介绍、RFM项目数据加载和数据处理、RFM项目RFM计算、RFM项目RFM可视化、RFM项目业务解读和小结

学完后具备如下能力: 1. 掌握Pandas案例; 2. 知道绘图库使用; 3. 掌握Pandas数据ETL; 4. 掌握Pandas数据分析项目流程。

阶段四 机器学习多场景项目实战
| 机器学习简介
人工智能概述、机器学习开发流程和用到的数据介绍、特征工程介绍和小结、机器学习算法分类、机器学习模型评估、_数据分析与机器学习
| K近邻算法
K近邻算法基本原理、K近邻算法进行分类预测、sklearn实现knn、训练集测试集划分、分类算法的评估、归一化和标准化、超参数搜索、预测facebook签到位置案例、K近邻算法总结
| 线性回归
线性回归简介、线性回归API使用初步、导数回顾、线性回归的损失函数和优化方法、梯度下降推导、波士顿房价预测案例、欠拟合和过拟合、模型的保存和加载、线性回归应用-回归分析
| 逻辑回归
逻辑回归简介、逻辑回归API应用案例、分类算法评价方法、逻辑回归应用_分类分析
| 聚类算法
聚类算法的概念、聚类算法API的使用、聚类算法实现原理、聚类算法的评估、聚类算法案例
| 决策树
决策树算法简介、决策树分类原理、特征工程-特征提取、决策树算法api、决策树案例
| 集成学习
集成学习算法简介、 Bagging和随机森林、 随机森林案例、 Boosting介绍、 GBDT介绍、 XGBOOST介绍、 LightGBM介绍
| 机器学习进阶算法
SVM、朴素贝叶斯
| 用户画像案例
用户行为分析、用户画像标签分类、统计类标签、用户分群模型、用户流失预测
| 电商运营数据建模分析案例
零售销售报表、数据探索性分析、特征工程、模型训练与特征优化、模型部署上线

学完后具备如下能力: 1. 掌握机器学习建模流程; 2. 知道Sklearn机器学习库使用; 3. 掌握常见的机器学习分类、回归、聚类算法; 4. 掌握机器学习常见应用场景。

阶段五 金融风控项目
| 金融风控项目介绍
传统金融由于风控审批主要靠人工进行,审批速度慢,一般只服务大公司,或者收入较高的人群,很多低端、无稳定收入的群体和小微企业无法享受到传统金融服务。面临如此庞大的市场,小额贷款作为新型的金融服务产品应运而生,小额贷款业务具有单笔金额小、单笔利润低、利润率高、审批速度快的热点,所以基于用户申请信息的快速自动审批系统(风控系统)就成了互联网金融领域核心的竞争力。金融风控项目搭建了整套金融风控知识体系,从反欺诈、信用风险策略、评分卡模型构建等热点知识,使得学员具备中级金融风控分析师能力。

学完后具备如下能力: 1. 掌握金融风控相关业务知识; 2. 掌握机器学习项目特征工程通用方法; 3. 掌握评分卡建模特征工程方法; 4. 掌握评分卡模型构建、调优与监控方法; 5. 掌握常用异常点检测算法的应用; 6. 掌握模型解释常用方法。

阶段六 深度学习基础
| 神经网络基础
神经网络的构成、激活函数、损失函数、优化方法及正则化、反向传播原理、梯度下降算法、链式法则、反向传播算法、改善反向传播算法性能的迭代法、深度学习正则化与算法、L1、L2、DroupOut、BN、SGD、RMSProp、Adagrad、Adam
| 深度学习框架对比
Pytorch、Tensorflow、MxNet、paddlepaddle
| Pytorch框架
Pytorch介绍、张量概念、张量运算、反向传播、梯度、自动梯度、参数更新、数据加载器、迭代数据集

学完后具备如下能力: 1. pytorch工具处理神经网络涉及的关键点; 2. 掌握神经网络基础知识|3.掌握反向传播原理; 3. 了解深度学习正则化与算法优化。

阶段七 自然语言处理
| NLP入门
经典案例、对话系统简介、NLU简介、文本生成简介、机器翻译简介、智能客服介绍、机器人写作介绍、作文打分介绍
| 文本预处理
文本处理的基本方法、文本张量表示方法、文本语料的数据分析、文本特征处理、数据增强方法、分词、词性标注、命名实体识别、one-hot编码、Word2vec、Word Embedding、标签数量分布、句子长度分布、词频统计与关键词词云
| RNN及变体
传统RNN、LSTM、Bi-LSTM、GRU、Bi-GRU、新闻分类案例、机器翻译案例、seq2seq、遗忘门、输入门、细胞状态、输出门、更新门、重置门
| Transfomer原理
输入部分、输出部分、编码器部分、解码器部分、线性层、softmax层、注意力机制、多头注意力机制、前馈全连接层、规范化层、子层连接结构、语言模型、wikiText-2数据集、模型超参数、模型的训练、模型验证
| 迁移学习
fasttext工具、进行文本分类、CBOW模式、skip-gram模式、预训练模型、微调、微调脚本、训练词向量、模型调优、n-gram特征、CoLA 数据集、SST-2 数据集、MRPC 数据集、BERT、GPT、GPT-2、pytorch.hub

学完后具备如下能力: 1. 掌握NLP领域前沿的技术解决方案; 2. 了解NLP应用场景; 3. 掌握NLP相关知识的原理和实现; 4. 掌握传统序列模型的基本原理和使用; 5. 掌握非序列模型解决文本问题的原理和方案; 6. 能够使用pytorch搭建神经网络; 7. 构建基本的语言翻译系统模型; 8. 构建基本的文本生成系统模型; 9. 构建基本的文本分类器模型; 10. 使用ID-CNN+CRF进行命名实体识别; 11. 使用fasttext进行快速的文本分类; 12. 胜任多数企业的NLP工程师的职位。

阶段八 美创AI医生项目
| 美创AI医生项目介绍
在线医生项目是一个基于自然语言理解方向的问答机器人。类似的应用,还有百度地图的小度、天猫精灵、淘宝小蜜,招商银行的小招等。该项目结合医学知识图谱、深度学习、对话管理、微信公众号开发等技术,旨在降低首医成本,为患者提供基本医学诊断意见服务。技术层面包含语音识别、自然语言理解、对话管理以及自然语言生成等环节,其中又包含领域识别,用户意图识别,槽位填充,对话状态追踪,对话策略等技术细节。功能上为患者提供根据症状信息给出诊断意见任务与就近治疗任务。通过学习该课程,学生可以了解多轮多任务对话系统的技术点以及业务流程。

学完后具备如下能力: 1. 掌握人工智能处理原始数据到模型所需数据的全流程; 2. 掌握抽取式摘要模型textRank的实现流程和原理; 3. 掌握如何利用gensim工具训练word2vec词向量; 4. 掌握垂直领域词向量训练的经验和技能; 5. 掌握经典seq2seq架构完成文本摘要任务; 6. 掌握前沿PGN架构完成文本摘要任务; 7. 掌握评估生成式任务的BLEU算法和ROUGE算法理论和实现; 8. 掌握coverage机制的原理和实现; 9. 掌握beam-search的原理和实现; 10. 掌握单词替换, 回译数据, 半监督学习等主流数据增强的算法; 11. 掌握Scheduled Sampling和Weight Tying的训练策略优化; 12. 掌握AI模型的硬件部署优化, GPU部署, CPU部署等等。

阶段九 蜂窝AI文本摘要项目
| 蜂窝AI文本摘要项目介绍
文本摘要项目是一个基于NLP底层基础任务的全流程实现项目。在工业界有广泛应用,比如四六级的阅读理解考试,新浪体育的球评新闻,今日头条的新闻快递,金融简报等等。涉及到互联网场景下海量的大段文本的信息压缩和融合技术,可以让人们在信息爆炸的时代快速浏览重要信息。通过本项目的学习,可以掌握工业界最主流的处理文本摘要的模型和优化技术。这里面关于解码方案的优化,数据增强的优化,还有训练策略的优化,无论是理论还是代码,都可以非常方便的迁移到未来企业级的开发中。同时在部署方案上,掌握GPU部署和CPU部署的相同点和不同点。

学完后具备如下能力: 1. 掌握人工智能处理原始数据到模型所需数据的全流程; 2. 掌握抽取式摘要模型textRank的实现流程和原理; 3. 掌握如何利用gensim工具训练word2vec词向量; 4. 掌握垂直领域词向量训练的经验和技能; 5. 掌握经典seq2seq架构完成文本摘要任务; 6. 掌握前沿PGN架构完成文本摘要任务; 7. 掌握评估生成式任务的BLEU算法和ROUGE算法理论和实现; 8. 掌握coverage机制的原理和实现; 9. 掌握beam-search的原理和实现; 10. 掌握单词替换, 回译数据, 半监督学习等主流数据增强的算法; 11. 掌握Scheduled Sampling和Weight Tying的训练策略优化; 12. 掌握AI模型的硬件部署优化, GPU部署, CPU部署等等。

百京金融风控

传统金融由于风控审批主要靠人工进行,审批速度慢,一般只服务大公司,或者收入较高的人群,很多低端、无稳定收入的群体和小微企业无法享受到传统金融服务。面临如此庞大的市场,小额贷款作为新型的金融服务产品应运而生,小额贷款业务具有单笔金额小、单笔利润低、利润率高、审批速度快的热点,所以基于用户申请信息的快速自动审批系统(风控系统)就成了互联网金融领域核心的竞争力。金融风控项目搭建了整套金融风控知识体系,从反欺诈、信用风险策略、评分卡模型构建等热点知识,使得学员具备中级金融风控分析师能力。

技术亮点:

  • 风控领域业务知识介绍:常见信贷风险、金融风控领域常用术语等
  • 评分卡建模概述:信贷审批业务基本流程、ABC评分卡概念、正负样本定义方法等
  • 评分卡建模特征工程:特征衍生、特征交叉、特征评估与筛选
  • 机器学习评分卡模型训练:逻辑回归评分卡、集成学习评分卡、模型评价(KS,AUC),评分映射方法,模型报告
  • 不均衡学习和异常点检测:样本不均衡的处理方法,异常点检测的常用方法
  • 美创医疗在线AI医生

    该项目结合医学知识图谱、深度学习、对话管理、微信公众号开发等技术,旨在降低首医成本,为患者提供基本医学诊断意见服务。技术层面包含语音识别、自然语言理解、对话管理以及自然语言生成等环节,其中又包含领域识别,用户意图识别,槽位填充,对话状态追踪,对话策略等技术细节。功能上为患者提供根据症状信息给出诊断意见任务与就近治疗任务。通过学习该课程,学生可以了解多轮多任务对话系统的技术点以及业务流程。

    技术亮点:

  • 基于医疗知识图谱的实体检索技术
  • 基于bert迁移学习的命名实体审核技术
  • 基于BiLSTM+CRF的命名实体识别技术
  • 基于微信公众号和flask的模型部署服务
  • 基于语音识别与语音生成技术的与患者语音沟通的交互方式
  • 基于端到端以及结合知识库的多轮多任务对话系统网络结构
  • 数据清洗以及知识抽取、知识图谱构建
  • 基于图数据库neo4j
  • 基于mem2seq模型论文到代码实现
  • 蜂窝头条文本摘要项目

    文本摘要项目是一个基于NLP底层基础任务的全流程实现项目。在工业界有广泛应用,比如四六级的阅读理解考试,新浪体育的球评新闻,今日头条的新闻快递,金融简报等等。涉及到互联网场景下海量的大段文本的信息压缩和融合技术,可以让人们在信息爆炸的时代快速浏览重要信息。通过本项目的学习,可以掌握工业界最主流的处理文本摘要的模型和优化技术。这里面关于解码方案的优化,数据增强的优化,还有训练策略的优化,无论是理论还是代码,都可以非常方便的迁移到未来企业级的开发中。同时在部署方案上,掌握GPU部署和CPU部署的相同点和不同点。

    技术亮点:

  • 工业场景下的原始数据取舍, 去噪, 构建模型可用数据
  • 搭建基于textRank的抽取式文本摘要模型, 并进行评估
  • 搭建基于经典seq2seq架构的生成式文本摘要, 并进行评估
  • 搭建基于PGN先进架构的生成式文本摘要, 并进行评估
  • 详细解析生成式NLP任务的评估算法BLEU和ROUGE, 并实现rouge的评估代码
  • 针对于损失函数的优化方案coverage解决文本重复问题
  • 针对于解码器端的优化, 按照beam search进行解码的实现方案
  • 针对于NLP领域数据增强的实现方案, 采用单词替换法, 回译数据法, 半监督学习法的理论和代码实现
  • 针对于训练策略的优化, Scheduled Sampling和Weight Tying的理论和代码实现
  • 实现模型的GPU部署和CPU部署