课程

课程介绍

本课程从实战的角度对自然语言处理(NLP)进行了全面的剖析,并结合实际案例分析和探讨NLP的应用场景,给NLP相关从业人员以指导和启迪。

培训对象

对此课程感兴趣的人员;
从事计算机语言工作的IT人员;
从事数据分析数据管理的IT人员。

课程收益

掌握NLP基础;
关键词提取与文本分类方法;
文本向量化与句法分析方法;
NLP与深度学习技术的相应算法;
理解并掌握Tensorflow框架。

知识概要

-- NLP入门与基础介绍;
-- 关键词提取与文本分类;
-- 文本向量化与句法分析;
-- NLP与深度学习。

课程大纲

模块

学习内容

第一天上午

NLP入门与基础介绍(一)

1.NLP的基本概念

2.NLP的发展历程

3.NLP主要研究方向

1)句法语义分析

2)信息抽取

3)文本挖掘

4)机器翻译

5)信息检索

6)问答系统

7)对话系统

第一天下午

NLP入门与基础介绍(二)

4.NLP的基础

1)分词

正向最大匹配算法

逆向最大匹配算法

双向最大匹配算法

基于N-gram语言模型的分词

基于HMM的分词方法

基于CRF的分词法法

2)文本基本处理

文本提取

正在表达式

本文统计

3)词性标注

基于最大熵的词性标注

基于统计最大概率输出词性

基于HMM词性标注

基于CRF的词性标注

4)命名实体识别

基于CRF的命名实体识别

5.案例

1)在线中文分词系统实战

2)命名实体识别接口开发

3)基于词性标注的关键词提取

第二天上午

关键词提取与文本分类

1.关键词提取概述

2.关键词提取算法

1)TF-IDF

2)LSA/LSI算法

3)PLSA算法

4)LDA算法

3.文本分类算法

1)朴素贝叶斯

2)线性分类器

3)支持向量机

4)Bagging模型

5)Boosting模型

6)浅层神经网络

4.案例

1)新闻主题提取

2)新闻分类实战

第二天下午

文本向量化与句法分析

1.文本向量化概述

2.文本向量化常用算法

1)词袋算法

2)HashTF算法

3)Word2Vec算法

4)Glove算法

3.句法分析概述

4.句法分析常用算法

1)PCFG算法

2)条件随机场算法

5.案例

1)文本情感分析的开发示例

2)基于依存句法分词的问句相似度计算

第三天上午

NLP与深度学习(一)

1.深度学习概述

1)神经网络

2)损失函数

3)梯度下降

2.深度学习常用算法

1)CNN

2)RNN

3)GRU

4)LSTM

第三天下午

NLP与深度学习(二)

3.Tensorflow框架学习

1)Tensorflow简介

2)Tensorflow安装

3)Tensorflow基础使用

图(graphs)

会话(session)

张量(tensor)

变量(Variable)

4)Tensorflow线性回归以及分类的简单使用

5)Tensorflow中各种优化器的介绍

4.案例

1)基于CNN的文本分类

2)基于RNN的歌词生成

3)基于LSTM的机器翻译

4)基于Seq2Seq的问答系统

认证过程

无认证考试

开班信息

暂无开班信息