Back to site

Базавыя пытанні


Пыт.: Што такое Unicode?

Адк.: Unicode з'яўляецца ўніверсальнай кадоўкі знакаў, якія вядуцца кансорцыумам Unicode. Гэты стандарт кадавання забяспечвае аснову для апрацоўкі, захоўванні і абмену тэкставай інфармацыі на любой мове, ва ўсіх сучасных праграмных сродкаў і пратаколаў інфармацыйных тэхналогій. Гл. "Што такое Unicode?" на кароткае тлумачэнне таго, што Unicode гэта ўсё о. Гэта старонка перакладзена больш за на 50 Мовы, каб праілюстраваць выкарыстанне гэтага стандарту. Пераканаецеся ў гэтым самі!

Пыт.: Што такое сфера Unicode?

Адк.: Unicode ахоплівае ўсе знакі ўсіх пісьменнасцяў свету, сучасныя і старажытныя. Яна таксама складаецца з тэхнічныя знакі, пунктуацыя і шматлікіх іншых знакаў, выкарыстоўваных у пісьмовым тэксце. Unicode стандарт прызначаны для забеспячэння запатрабаванняў усіх катэгорый карыстачоў, няхай гэта будзе ў бізнэсе ці ў навуковых, выкарыстоўваючы асноўны ці меншасці сцэнараў.

Пыт.: Колькі Мовы абхоплены Unicode?

Адк.: Цяжка сказаць, таму што Unicode кадуе сцэнары для Мовы, а не Мовы як такі. Шматлікія сцэнары (асабліва ў лацінскай транскрыпцыі) выкарыстоўваюцца для запісу вялікага ліку Мовы. Самы просты адказ у тым, што Unicode ахоплівае ўсе Мовы, якія могуць быць запісаны ў наступныя сцэнары: лацінскі, грэцкі, кірыліца, армянскі, іўрыт, арабскі, сірыйскі, Таана, деванагары, бенгальскі, Гурмукхі, арыя, тамільскі, телугу, каннада, малаялам, сінгальскі, тайскі, Лаоса, Тыбета, М'янмы, грузінскі, хангыль, Эфіёпскі, Cherokee, Канадскі складовы ліст, кхмерскім, мангольскі, Хань (японскі, кітайскі, карэйскі іерогліфы), хірагана, катакана і Йі. Unicode уключае шмат гістарычных сцэнараў, прызначаных для запісу даўно памерлага Мовы, а таксама меней распаўсюджаных рэгіянальных сцэнараў, якія могуць быць скарыстаны ў якасці другога (ці нават трэці) спосаб напісання дадзенай мовы. Паказаць Падтрымоўваныя скрыпты для атрымання поўнага спісу. Гл. таксама спіс Мовы і скрыпты.

Пыт.: Ці ёсць Unicode кадаванні сцэнары ці Мовы?

Адк.: Стандарт Unicode кадуе знакі ў сцэнар аснове. Так, напрыклад, ёсць толькі адзін набор лацінскіх знакаў, вызначаных, нягледзячы на той факт, што лацінскі алфавіт выкарыстоўваецца для алфавітаў тысяч розных Мовы. Той жа прынцып дастасоўны для любой іншай сцэнар (кірыліца, арабскі, эфіёпскі, дэванагары, ...), які выкарыстоўваецца для напісання розных Мовы. Тым не менш, стандарт Unicode не кадуе сцэнары як такі. Для пераліку скрыпту імёны, гл. UTR #24, Unicode сцэнара ўласнасці. Для стандартнага ISO для сцэнара кодаў, гл. ISO / IEC 15924, код для пазначэння назваў скрыптоў. Для стандартнага ISO на моўныя коды, гл. ISO 639, код для пазначэння назваў Моў.

Пыт.: Чаму Unicode аб'яднаць кітайскім, японскім і карэйскім мовах іерогліфы, але не аб'яднаць лацінскі, грэцкі і кірыліцу?

Адказ: Для падрабязнага адказу, гл. http://www.unicode.org/notes/tn26/.

Пыт.: Якая сувязь паміж Unicode і міжнароднага стандарту ISO / IEC 10646?

Адказ: 10646 і Unicode паказаць кадоўку ж: яны ўтрымоўваюць тыя ж персанажы ў тых жа месцах. Яны па-ранейшаму цалкам сінхранізаваны нават калі яны распаўсюджваюцца на пакрыццё дадатковых знакаў. Гл. Unicode і ISO 10646 FAQ і Прыкладанне Са стандарту Unicode для шырэйшага тлумачэнне іх адносін.

Пыт.: Я думаю, што мая кампанія, магчыма, захочаце прыняць удзел у Unicode. Ці ёсць якія-небудзь матэрыялы, якія я магу выкарыстоўваць у наш час справа майго кіраўніцтва?

A: Так, ёсць белы дакумент з выкладам агульнай прапанова значэнне чалецтва Unicode для арганізацыі. Паказаць Чаму далучацца і парадак далучэння.

Пыт.: Дзе я магу купіць праграмнае забеспячэнне ці Unicode шрыфт?

Адк.: Стандарт Unicode не праграмнае забеспячэнне, роўна як і шрыфт. Гэта сістэма кадоўкі знакаў, як ASCII, закліканай дапамагчы распрацоўнікам, якія жадаюць ствараць прыкладанні, якія працуюць на любой мове свету.

Калі ўсё, што вам трэба, гэта стварыць шматмоўны тэкст ці напісаць дакумент ці адправіць па электроннай пошце на іншай мове, то Unicode-сумяшчальных тэкставы рэдактар, паштовую праграму ці пакет апрацоўкі тэкстаў будзе рабіць гэту працу. Калі ласка, гл. на наступных старонках нашага сайта для атрымання дадатковай інфармацыі пра стандартныя і куды звярнуцца за дапамогай:

Калі вы з'яўляецеся распрацоўнікам, пачынальна каб пазнаць пра выкарыстанне Unicode, вы павінны атрымаць копію апошняй версіі стандарту Unicode, каб пазнаць больш о Unicode. У дадатак да старонак, пералічаных вышэй, гл.:


Пыт.: Я не магу знайсці знак у Unicode. Дзе я магу паглядзець?

Пагледзіце на " Дзе мой характар? "

Пыт.: Дзе я магу знайсці рэсурсы, каб дапамагчы мне з Unicode?

Адк.: Вось кароткі табліцы, прапануе спасылкі на інфармацыю, якая можа адказы на тыповыя пытанні.

Пытанне

Спасылка

  • Што ў кожнай пэўнай версіі Unicode?

  • Што ў апошняй версіі Unicode?

Версіі стандарту Unicode

Нумараваныя версіі

  • Што гэта значыць адмысловы тэрмін?
Гласар Unicode ці тэрміналогія для перакладу тэрмінаў
  • Дзе я магу знайсці код бібліятэкі, камерцыйных ці з адкрытым зыходным кодам, для наступных?

    • пераўтварэнні знакаў

    • супастаўленне

    • дату, час, нумар і фарматаванні паведамленняў

    • нармалізацыя

    • і іншых функцый, згаданых у частцы "Які ўзровень падтрымкі я павінен шукаць?"

Unicode старонцы "Рэсурсы", у прыватнасці, на ўкладцы Інтэрнацыяналізацыя Бібліятэкі

  • Што трэба рабіць рэгулярныя выразы з Unicode?

  • Ці магу я перадаць Unicode тэкст у сістэмах EBCDIC?

  • Як тэкставы працэсар ліній парыву ў тэкст Unicode?

  • Ці існуюць шляхі да нармалізацыі Unicode тэкст?

  • Для Далёкага Ўсходу, як я магу вырашыць, якія знакі варта выкарыстоўваць шырокі знакаў, а якія вузкія?

  • Як я павінен роды Unicode тэкст?

  • Ці ёсць абнаўленне алгарытму BIDI?

  • Як сціснуць Unicode тэкст?

Unicode тэхнічных справаздач а таксама

FAQ: Тэхнічныя характарыстыкі

  • Я жадаю атрымліваць аператыўныя дадзеныя для ажыццяўлення Unicode. Дзе я магу знайсці дадзеныя:

    • Характар уласцівасці?

    • Верхні і ніжні / titlecasing?

    • Раскладанні?

    • Нармалізацыя?

    • Пераход на іншыя кадоўкі знакаў?

    • Код для кандзі перакадоўкі сціснутым табліцы?

Online Data

  • Ёсць канферэнцый і семінараў, дзе можна знайсці больш падрабязную інфармацыю о Unicode?

Unicode канферэнцыі

  • Хто ў наш час з'яўляюцца чальцамі кансорцыума?

  • Я зацікаўлены ў далучэнні да кансорцыума. Дзе я магу пазнаць больш?

Чалецтва інфармацыі

Нашы чальцы

Пыт.: Што такое Unicode адпаведнасці патрабуецца?

Адказ: Частка 3, Адпаведнасць абмяркоўвае гэта ў дэталях. Тут вельмі нефармальнай версія:


Пыт.: Можна проста выкарыстоўваць прыкладання неназначенный знакі, як яны жадаюць?

Адк.: Не! Не сумяшчальныя рэалізацыі Unicode можна выкарыстоўваць не-закадаваныя значэнні за межамі вобласці прыватнага выкарыстання.

Толькі значэнні ў вобласці прыватнага выкарыстання (E000.. F8FF, F0000 FFFFD .. і .. 10FFFD 100000) з'яўляюцца законнымі для прыватнага прызначэння. Аднак, гэта больш 137 000 кодавых кропак, якія павінны быць больш за досыць для пераважнай большасці рэалізацый.

Пыт.: Ёсць сурагатныя знакі ж, як і дадатковыя знакі?

Адказ: Гэта пытанне паказвае агульнае замяшанне. Гэта вельмі важна адрозніваць сурагатнай кодамі (у дыяпазоне ад U + D800 .. U + DFFF) за кошт дадатковых кодамі (у зусім іншы дыяпазон, U +10000 .. U +10 FFFF). коды сурагатнага зарэзерваваны для выкарыстання у парах, ва ўяўленні дадатковых пунктаў код у UTF-16.

Ёсць дадатковыя знакі (напрыклад, закадаваныя знакі ўяўляе сабою адзін дадатковы пункт код), але не Існуюць і ніколі не будзе сурагатных знакаў (напрыклад, закадаваныя знакі ўяўляе сабою адзін сурагатнай кропкі код).

Пыт.: У чым розніца паміж UCS-2 і UTF-16?

Адк.: UCS-2 з'яўляецца тое, што ажыццяўленне Unicode было да Unicode 1,1 да сурагатнай кодамі і UTF-16 былі дададзены канцэпцыі да версіі 2.0 стандарту. Гэты тэрмін варта цяпер пазбягаць.

Пры інтэрпрэтацыі, што людзі маюць на ўвазе пад "UCS-2" у мінулым выкарыстанні, лепш за ўсё разглядаць як не фармат дадзеных, а як сведчанне таго, што рэалізацыя не інтэрпрэтаваць любыя дадатковыя знакі. У прыватнасці, у мэтах абмену інфармацыяй, UCS-2 і UTF-16 ідэнтычныя фарматаў. Абодва 16-біт, і сапраўды гэтак жа ўяўленне блок кода.

Эфектыўнага розніца паміж UCS-2 і UTF-16 знаходзіцца на іншым узроўні, калі адзін перакладае кодавую паслядоўнасць адзінак, коды ці знакі. У гэтым выпадку, UCS-2 рэалізацыя не будзе весці апрацоўку, як знак уласцівасці, codepoint меж, супастаўленні, і т. д. для дадатковых знакаў.

Пыт.: Што я магу зрабіць, калі я думаю, што ёсць памылка ў Unicode стандарт ці іншыя тэхнічныя?

Адк.: Запыт на выпраўленне, удакладненне ці змена адпаведных спецыфікацыі шляхам падачы зваротнай сувязі ці афіцыйная прапанова па адпаведных тэхнічных камітэтам (UTC ці CLDR-TC). Гл. публічнага абмеркавання пытанняў на тлумачэнне таго, як гэта зрабіць. (Метады розныя для двух камітэтаў і тып змен прасіла.)

Published (Last edited): Apr 14 , source: http://www.unicode.org/faq/basic_q.html