课程介绍
人工智能、数据挖掘等技术用于数据分析和决策支持。机器学习是数据挖掘的主要方法之一,它是一种使获取知识自动化的计算方法的学习,通俗地说,机器学习领域感兴趣的是怎样编写计算机程序能够通过案例进行模仿学习。
培训对象
需要了解文本分析NLP技术的相关人员。
课程收益
通过文本分析核心原理精讲和文本核心处理技术工具的实操练习,可以掌握文本分析关键技术使用,便于把文本分析技术落地到自己的工作实践中。
知识概要
-- 文本分析基础;
-- 文本分析词法分析;
-- 文本分析语法理论;
-- 文本分析语义分析;
-- 文本分析篇章分析;
-- 文本分析实战练习。
课程大纲
文本分析基础
文本分析基本概念和应用
数学基础
概率论基本概念
概率
最大似然估计
条件概率
贝叶斯法则
随机变量
二项式分布
联合概率分布和条件概率分布
贝叶斯决策理论
期望和方差
图灵机与文本分析
文本分析词法分析
概率语法
词法分析与词性标注
词频-逆向文件频率(TF-IDF)
Word2Vec
计数向量器
分词器(Tokenization)
移除停用词(StopWordsRemover)
n-gram
二值化
主成分分析(PCA)
多项式展开(PolynomialExpansion)
离散余弦变换(DCT)
字符串-索引变换(StringIndexer)
索引-字符串变换(IndexToString)
独热编码(OneHotEncoder)
向量-索引变换
交互式(Interaction)
正则化(Normalizer)
规范化(StandardScaler)
最大值-最小值缩放(MinMaxScaler)
最大值-绝对值缩放(MaxAbsScaler)
文本分析语法理论
语言模型
n元语法的基本概念
数据平滑方法
句法分析
句法结构分析概述
基于PCFG的基本分析方法
句法规则提取方法
HP分析算法
浅层句法分析
文本分析语义分析
语义计算
词义消歧概述
有监督的词义消歧方法
基于贝叶斯分类器的消歧方法
基于贝叶斯分类器的消歧方法
基于词典的词义消歧方法
无监督的词义消歧方法
词义消歧系统评价
语义角色标注基本方法
双语联合语义角色标注方法
文本分析篇章分析
言语行为理论
中心理论
修辞结构理论
脉络理论
基于贝叶斯分类器的消歧方法
篇章表示理论
篇章衔接性,连续性
篇章标注语料库
文本分析实战练习
Web文本分析
知识图谱-基于知识库的文本分析
文本分析python实践
认证过程
无认证考试
开班信息
暂无开班信息