嗨。如果你看上面的图片,你会看到一组非常奇怪的字符显示与一些拉丁字符。奇怪的是厄立特里亚字符。他们是我们在我国使用的字符。因此,为了直截了当,我希望创建甚至是最简单的软件,甚至可能是一个批处理文件 (如果可能的话),以帮助我使这些字符在网络上适用,并使 PC 理解和显示它们时被键入。
谢谢
您的问题是“如何创建一种语言”,因此我将描述一种新语言(或更准确地说,是书写系统)所需的所有内容。您特别询问厄立特里亚字母,因此我将提供有关现代系统如何支持厄立特里亚字母的具体示例,并尝试为您提供缺少的部分的指针。答案很长,并提供了很多链接来支持这两个解释。
要使用像Ge'ez这样的脚本来工作,您需要使用代码来支持 a /a>(也称为 Ethiopic,该脚本用于在埃塞俄比亚编写 Amharic 和在厄立特里亚编写 Tigrinya)。您需要一些东西。首先是一种编码字符的方法;一组表示每个字符的数字,计算机可以用来表示文本。幸运的是,Unicode
现在,Unicode 只是一个character set;当字符和数字之间的抽象映射时,它将提供一个更有效的 UTF 编码。要将这些字符作为字节序列进行实际传输,您可以使用character encoding。有很多编码;其中一些,例如ASCII和ISO-8859-1仅覆盖完整 Unicode 字符集的子集,而其他的
如果您使用的编码没有覆盖 Unicode 的全部范围,或者您没有很好的方法来键入这些字符,并且您正在编写 HTML 或 XML,则可以使用numeric character references来代替。为此,您可以在&#
和;
之间编写要引用的字符的 Unicode 代码点。您可以在十进制中编写数字,或者在十六进制中编写
现在,您有了一个字符集,并且有了一种对其进行编码的方法,因此您需要一种显示它的方法。某些脚本更容易在其他脚本中显示。对于所有脚本,您需要一个font;一个定义每个字符外观的文件。字体包含一个字形集合,或每个字符的绘图。一些脚本,例如Latin alphabet(在之前使用的字母)相对简单。
幸运的是,Ge 'ez 是一个相当简单的书写系统,不需要任何专门的渲染支持或高级字体系统。每个字符都是一个单独的字形,不需要任何重新排序。因此,大多数计算机上已经可用的渲染系统显示的普通OpenType字体将完成这项工作。但是您仍然需要字体才能显示>字符。要创建
对于 Ethiopic,您不需要创建自己的。Windows / Vista 中已经有numerous fonts available版本,其中包含 Ethiopic 字符,但我建议使用来自SIL(夏季语言学研究所)的Abyssinica SIL,这对于少数民族语言和书写系统来说是很多伟大的工作。他们的字体在free license下可用。
有了字体后,您将能够查看埃塞俄比亚文字。但是其他阅读您的文档的人可能没有这些字体(如果他们使用的是旧版本的 Windows 或 Mac OS X,如果他们没有安装 Windows 附带的所有字体等),在这种情况下,这些字符可能会在其计算机上显示为框或问号。您可以给这些人一个可再发行的字体,例如 Abyssinica SIL,或者他们可以购买一个
在一个网页上,你可以使用web fonts和 ai来从你的样式表中链接到一个字体,让你的网络浏览器加载该网页的所有字体。all the way back to IE 6,你可以在最近的版本中支持不同的网络浏览器支持不同的字体文件格式 (EOT3)。
@font-face {
font-family: 'abyssinica_silregular';
src: url('abyssinicasil-r.eot');
src: url('abyssinicasil-r.eot?#iefix') format('embedded-opentype'),
url('abyssinicasil-r.woff') format('woff'),
url('abyssinicasil-r.ttf') format('truetype'),
url('abyssinicasil-r.svg#abyssinica_silregular') format('svg');
font-weight: normal;
font-style: normal;
}
既然您已经知道如何编码埃塞俄比亚文,查看埃塞俄比亚文字符以及共享包含埃塞俄比亚文字符的文档,那么您可能希望将它们键入文档中。如果您使用 HTML,则可以只键入上述数字字符引用。在其他文档中,您可以从所有这些字符的图表中复制并粘贴字符,例如 Wikipedia 页面。但这将变得非常麻烦。根据您的系统和设置,您还可以使用
要完全支持在您的计算机上键入脚本,您需要使用0或input metd的键布局来创建一个,您可以在 Mac 上使用一个键键,您可以使用简单的键盘布局来键入两个字符。Dead keys 如果您需要的字符多于修饰符和死键所支持的字符,例如键入中文或日文,则需要一种成熟的输入法。输入法允许您运行任意代码以将某人键入的内容映射到其生成的文本中;例如,在日语输入法中,您可以键入您正在编写的内容的语音表示形式,它将向您显示与该表示形式匹配的可能字符的下拉列表,允许您选择 用于 Ethiopic 的standard input metd支持 Windows 的输入 /a>,因此您可以在 Windows 上使用它来支持死键。它看起来像 Ethiopic 最流行的现有输入法是Keyman,它是一种在 Mac 和 Windows 上运行的商业输入法,此外还有一个在 Linux 上运行的免费变体KMFL。SIL 具有3 如果你只需要支持一个网站上的输入,你也可以在 JavaScript 中提供一个基于输入的方法,通过在 JavaScript 中编写一个输入法,它可以从某人输入到 Ethiopic 中。我不知道任何现有的框架;但是,我发现Korean和Japanese输入法在 JavaScript 中实现。你可以看看那些是如何实现的。 有了上述所有内容(字符集,编码,字体,渲染支持和输入法),您将能够在脚本中创建,共享和查看文档。如果这就是您所需要的,那就太好了;上面将允许您使用给定脚本中的文档。但是,要在计算机上完全支持一种语言,而不仅仅是其脚本或编写系统,还需要另外两个部分:locale进行本地化。 区域设置指定程序应如何在给定的脚本,语言,文化和 / 或编码中使用十进制语言来操作文本。程序可以执行许多常见的文本处理操作:显示数字,显示日期和时间,对字符串或名称进行排序等。这些工作方式可能会根据使用该程序的人的语言,脚本和文化而有所不同;例如,在瑞典语中,“ü”与“y”一起排序,而在英语和德语中,它可能不会与 命名区域设置的最广泛使用的标准是RFC 4646 (BCP 47)。区域设置通常以“ln-CC”指定,语言代码为ln,国家代码为CC:美国塞尔维亚语为 en-US,英国英语为 en-UK,法国法语为 fr-FR。 有多种不同的格式来定义特定区域设置所具有的规则。Windows 使用 NLP 文件,可以使用Microsoft Locale Builder创建自定义格式。可以使用localedef创建 POSIX(Unix / Linux)区域设置。如今,许多系统都朝着Unicode Common Locale Data Registry的方向发展,该格式为Unicode Common Locale Data Registry指定了许多语言环境的标准化格式。 最后,要完全支持一种语言,您需要将软件本身翻译成该语言。当然,有许多软件,每个软件都包含许多需要翻译的字符串。某些软件不是为翻译而设计的;它不是internationalized。某些软件只能由创建它的人翻译;字符串已内置到程序中,并且可能无法由第三方轻松修改以本地化软件。但是,可以将其本地化为其他语言。 例如,Mac OS X 上的应用程序可以将其本地化数据存储在应用程序包中的单独文件中4>。有一个名为 AppleGlot 的工具(您需要注册Mac Developer Program并转到下载区域以找到它),它可以帮助您提取该数据,为文件提供所有需要翻译的字符串,并允许您将其与应用程序再次结合使用。对于开源软件,例如您可以在 Linux 上使用大量翻译 当然,没有人可以完成上述所有操作;需要许多人共同努力才能在现代计算机系统上建立对新语言的支持。这一切都旨在对给定语言的语言支持中的所有组件进行高级介绍,并提供参考资料,以帮助您跟进要处理的任
如果它们是 Unicode 字符,它们应该像任何其他语言的字符一样可显示。我用 Google 搜索了一下,发现了这个,希望它们和你要问的是一样的:
。
.
看到了吗?在 Web 浏览器或其他程序上显示它们不需要额外的工作。
这些是 Unicode Ethiopic 集(U + 1200..U + 137C)中的字符,以 UTF-8 编码:
第 1 行:
第 2 行:
刚刚遇到了同样的问题,但有一个简单的解决方案:谷歌现在提供了许多语言的 webfonts,也是 ethiopon:http://www.google.com/fonts/earlyaccess
本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处
评论列表(55条)