当前位置: 首页 > news >正文

腾讯云 个人网站网站营销建设方案

腾讯云 个人网站,网站营销建设方案,乐清问政网络平台,wordpress两边有空白PyTorch 实现 GloVe#xff08;Global Vectors for Word Representation#xff09; 的完整代码#xff0c;使用 中文语料 进行训练#xff0c;包括 共现矩阵构建、模型定义、训练和测试。 1. GloVe 介绍 基于词的共现信息#xff08;不像 Word2Vec 使用滑动窗口预测Global Vectors for Word Representation 的完整代码使用 中文语料 进行训练包括 共现矩阵构建、模型定义、训练和测试。 1. GloVe 介绍 基于词的共现信息不像 Word2Vec 使用滑动窗口预测  适合较大规模的数据比 Word2Vec 更稳定 学习出的词向量能捕捉语义信息如类比关系 import torch import torch.nn as nn import torch.optim as optim import numpy as np import jieba from collections import Counter from scipy.sparse import coo_matrix# 1. 数据预处理 corpus [我们 喜欢 深度 学习,自然 语言 处理 是 有趣 的,人工智能 改变 了 世界,深度 学习 是 人工智能 的 重要 组成部分 ]# 分词 tokenized_corpus [list(jieba.cut(sentence)) for sentence in corpus] vocab set(word for sentence in tokenized_corpus for word in sentence) word2idx {word: idx for idx, word in enumerate(vocab)} idx2word {idx: word for word, idx in word2idx.items()}# 计算共现矩阵 window_size 2 co_occurrence Counter()for sentence in tokenized_corpus:indices [word2idx[word] for word in sentence]for center_idx in range(len(indices)):center_word indices[center_idx]for offset in range(-window_size, window_size 1):context_idx center_idx offsetif 0 context_idx len(indices) and context_idx ! center_idx:context_word indices[context_idx]co_occurrence[(center_word, context_word)] 1# 转换为稀疏矩阵 rows, cols, values zip(*[(c[0], c[1], v) for c, v in co_occurrence.items()]) X coo_matrix((values, (rows, cols)), shape(len(vocab), len(vocab)))# 2. 定义 GloVe 模型 class GloVe(nn.Module):def __init__(self, vocab_size, embedding_dim):super(GloVe, self).__init__()self.w_embeddings nn.Embedding(vocab_size, embedding_dim) # 中心词嵌入self.c_embeddings nn.Embedding(vocab_size, embedding_dim) # 上下文词嵌入self.w_bias nn.Embedding(vocab_size, 1) # 中心词偏置self.c_bias nn.Embedding(vocab_size, 1) # 上下文词偏置nn.init.xavier_uniform_(self.w_embeddings.weight)nn.init.xavier_uniform_(self.c_embeddings.weight)def forward(self, center, context, co_occur):w_emb self.w_embeddings(center)c_emb self.c_embeddings(context)w_bias self.w_bias(center).squeeze()c_bias self.c_bias(context).squeeze()dot_product (w_emb * c_emb).sum(dim1)loss (dot_product w_bias c_bias - torch.log(co_occur 1e-8)) ** 2return loss.mean()# 初始化模型 embedding_dim 10 model GloVe(len(vocab), embedding_dim)# 3. 训练 GloVe criterion nn.MSELoss() optimizer optim.Adam(model.parameters(), lr0.01) num_epochs 100# 转换数据 co_occurrence_tensor torch.tensor(X.data, dtypetorch.float) pairs list(zip(X.row, X.col, co_occurrence_tensor))for epoch in range(num_epochs):total_loss 0np.random.shuffle(pairs)for center, context, co_occur in pairs:optimizer.zero_grad()loss model(torch.tensor([center], dtypetorch.long),torch.tensor([context], dtypetorch.long),torch.tensor([co_occur], dtypetorch.float) # 修正数据类型)loss.backward()optimizer.step()total_loss loss.item()if (epoch 1) % 10 0:print(fEpoch [{epoch 1}/{num_epochs}], Loss: {total_loss:.4f})# 4. 获取词向量 word_vectors model.w_embeddings.weight.data.numpy()# 5. 计算相似度 def most_similar(word, top_n3):if word not in word2idx:return 单词不在词汇表中word_vec word_vectors[word2idx[word]].reshape(1, -1)similarities np.dot(word_vectors, word_vec.T).squeeze()similar_idx similarities.argsort()[::-1][1:top_n 1]return [(idx2word[idx], similarities[idx]) for idx in similar_idx]# 测试 test_words [深度, 学习, 人工智能] for word in test_words:print(f【{word}】的相似单词:, most_similar(word))数据预处理 分词使用 jieba.cut()构建共现矩阵计算窗口内的单词共现频率使用稀疏矩阵存储提高计算效率 GloVe 模型 Embedding 层 训练词向量中心词和上下文词分开Bias 变量 用于调整预测值损失函数 最小化 log(共现次数) 与词向量点积的差值 计算词向量相似度 使用 cosine similarity找出 top_n 最相似的单词
http://www.sczhlp.com/news/206021/

相关文章:

  • 成功的wordpress网站建站平台 phpwind
  • 最佳经验网站支持api网站开发
  • 网站建设的心得体会网站设关键字
  • 建外贸网站费用重庆双八自助建设网站
  • 何如做外贸网站推网有自己团队做网站上线多久
  • 中小企业外贸网站建设现状临沂市住房和城乡建设局网站
  • 上海网址建设公司企业整站seo
  • 老干部活动中心网站建设方案江苏建设工程信息网官网
  • 网站建设市场有多大网站流量统计数据库设计
  • 山东省建设局网站监理员考试python做视频点播网站
  • 网站建设合同范本下载wordpress官网模板
  • 2025年多功能防水篷布厂家推荐排行榜,聚乙烯/帐篷/汽车/宴会/盖草布/泳池布/微喷水带/日用盖/农林用/重型机器用篷布公司精选
  • 白银市建设管理处网站广州市公司网站建设
  • 网站建设中请期待锐狐 网站 后台
  • 自己做的网站怎么接入微信wordpress超级开关
  • 网站建设初期的需求分析阿里云建立网站
  • 做跨境电商网站的意义wordpress要求配置
  • 烟台哪儿有可以做淘宝网站的网站新功能演示用什么技术做的
  • 网站制作优化推广ueeshop建站费用
  • 东盟建设集团有限公司网站外加工网
  • 学生做的动漫网站科技木是什么材料
  • 汽车商城网站模板营销型企业网站报价
  • 哪些网站使用vue做的wordpress站群seo
  • 自适应网站怎么做移动配置教做发型的网站
  • 深圳企业建站高性价比的选择wordpress 首页显示分类
  • 一个thinkphp搭建的微网站网址导航网址大全
  • 2025年润滑油厂家推荐排行榜,工业/汽车/发动机/甲醇发动机润滑油,全合成/长效润滑油公司精选
  • 2025年干燥机厂家推荐排行榜,小型喷雾/实验室离心喷雾/双锥回转真空/搪瓷双锥/旋转闪蒸/振动流化床/真空耙式/单层带式/多层带式/立式沸腾/卧式沸腾/滚筒刮板干燥机!
  • 17网站一起做网关镇铨装潢门店地址
  • 成都最新规划官方消息网站关键词优化效果