如何在字符级别对句子进行一次热编码?

如何在字符级别对句子进行一次热编码?,第1张

如何在字符级别对句子进行一次热编码?

只需将传递的字符串中的字母给定的字母进行比较:

def string_vectorizer(strng, alphabet=string.ascii_lowercase):    vector = [[0 if char != letter else 1 for char in alphabet]        for letter in strng]    return vector

请注意,使用自定义字母(例如“ defbcazk”),将在每个元素出现在原始列表中时对列进行排序。

输出

string_vectorizer('hello')

[[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5663612.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存