Lua – 从文件中读取一个UTF-8字符

Lua – 从文件中读取一个UTF-8字符,第1张

概述是否可以从文件读取一个UTF-8字符? file:read(1)返回奇怪的字符,当我打印它时. function firstLetter(str) return str:match("[%z\1-\127\194-\244][\128-\191]*")end 函数从字符串str返回一个UTF-8字符.我需要以这种方式读取一个UTF-8字符,但是从输入文件(不想将某些文件读取到内存中 – 通 是否可以从文件中读取一个UTF-8字符?

file:read(1)返回奇怪的字符,当我打印它时.

function firstLetter(str)  return str:match("[%z-74-4][8-1]*")end

函数从字符串str返回一个UTF-8字符.我需要以这种方式读取一个UTF-8字符,但是从输入文件(不想将某些文件读取到内存中 – 通过文件:read(“* all”))

问题非常类似于这篇文章:
Extract the first letter of a UTF-8 string with Lua

解决方法
function read_utf8_char(file)  local c1 = file:read(1)  local ctr,c = -1,math.max(c1:byte(),128)  repeat    ctr = ctr + 1    c = (c - 128)*2  until c < 128  return c1..file:read(ctr)end
总结

以上是内存溢出为你收集整理的Lua – 从文件中读取一个UTF-8字符全部内容,希望文章能够帮你解决Lua – 从文件中读取一个UTF-8字符所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1231472.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-06
下一篇 2022-06-06

发表评论

登录后才能评论

评论列表(0条)

保存