NLP 基于kashgari和BERT实现中文命名实体识别（NER）-白红宇

NLP 基于kashgari和BERT实现中文命名实体识别（NER）

阅读量：797 次

发布时间：2023-02-16

本文共 875 字，大约阅读时间需要 2 分钟。

准备工作

首先，确保您的 Python 环境符合要求，建议使用 Python 3.6 或更高版本。接下来，需要安装 Kashgari 库来处理 BERT 模型。

安装 Kashgari

通过以下命令安装适用于您的 TensorFlow 或 Keras 版本的 Kashgari：

如果使用 TensorFlow 2.x（>=2.0.0）：
```
pip install kashgari>=2.0.0
```

如果使用 TensorFlow 1.14+（<2.0.0）：
```
pip install kashgari>=1.0.0,<2.0.0
```

如果使用 Keras（<1.0.0）：
```
pip install kashgari<1.0.0
```

选择 BERT 模型

在本地或云端环境中，选择适合您的 BERT 模型。这里推荐使用工大发布的 BERT-wwm-ext 模型。

数据集准备

使用人民日报标注的中文数据集进行训练。以下是数据加载示例：

from kashgari.corpus import ChineseDailyNerCorpus# 加载训练数据train_x, train_y = ChineseDailyNerCorpus.load_data('train')valid_x, valid_y = ChineseDailyNerCorpus.load_data('validate')test_x, test_y = ChineseDailyNerCorpus.load_data('test')# 查看数据集大小print(f"训练数据数量：{len(train_x)}")print(f"验证数据数量：{len(valid_x)}")print(f"测试数据数量：{len(test_x)}")

输出结果：

训练数据数量：20864验证数据数量：2318测试数据数量：4636

创建 BERT嵌入

通过以下代码创建 BERT嵌入：

import kashgarifrom kashgari.embeddings import BERT

模型准备就绪。

转载地址：http://bcjfk.baihongyu.com/

你可能感兴趣的文章

npm学习（十一）之package-lock.json

查看>>

npm安装出现 npm ERR! code ETIMEDOUT npm ERR! syscall connect npm ERR! errno ETIMEDOUT npm ERR! 解决方法

查看>>

npm安装crypto-js 如何安装crypto-js, python爬虫安装加解密插件找不到模块crypto-js python报错解决丢失crypto-js模块

查看>>

npm安装教程

查看>>

npm报错Cannot find module ‘webpack‘ Require stack

查看>>

npm报错Failed at the node-sass@4.14.1 postinstall script

查看>>

npm报错fatal: Could not read from remote repository

查看>>

npm报错File to import not found or unreadable: @/assets/styles/global.scss.

查看>>

npm报错unable to access ‘https://github.com/sohee-lee7/Squire.git/‘

查看>>

npm淘宝镜像过期npm ERR! request to https://registry.npm.taobao.org/vuex failed, reason: certificate has ex

查看>>

npm版本过高问题

查看>>

npm的“--force“和“--legacy-peer-deps“参数

查看>>

npm的安装和更新---npm工作笔记002

查看>>

npm的常用操作---npm工作笔记003

查看>>

npm的常用配置项---npm工作笔记004

查看>>

npm的问题：config global `--global`, `--local` are deprecated. Use `--location=global` instead 的解决办法

查看>>

npm编译报错You may need an additional loader to handle the result of these loaders

查看>>

npm设置淘宝镜像、升级等

查看>>