UTF-1

유니코드
부호화 형식
  • UTF-7
  • UTF-8
  • CESU-8
  • UTF-16
  • UTF-32
  • UTF-EBCDIC
  • SCSU
  • 퓨니코드
  • GB18030
UCS
양방향 텍스트
BOM
한중일 통합 한자
유니코드 범위 목록
유니코드 등가성
유니코드와 HTML
유니코드와 전자 우편
유니코드 글꼴
v  d  e  h

UTF-1국제 문자 세트/유니코드바이트 스트림으로 변환하는 한 방법이다. 설계 상의 이유로, 디코딩이 문자 중간에 시작하면 재동기화가 불가능하며 바이트 지향 검색 루틴은 이와 함께 신뢰성있게 사용할 수 없다. UTF-1은 또한 제곱이 아닌 수의 나누기를 사용하기 때문에 상당히 느리다. 이러한 문제로 UTF-1은 폭넓게 채택되지 못했으며 UTF-8로 대체되었다.

설계

코드포인트 UTF-16BE UTF-16LE UTF-8 UTF-1
U+007F 00 7F 7F 00 7F 7F
U+0080 00 80 80 00 C2 80 80
U+009F 00 9F 9F 00 C2 9F 9F
U+00A0 00 A0 A0 00 C2 A0 A0 A0
U+00BF 00 BF BF 00 C2 BF A0 BF
U+00C0 00 C0 C0 00 C3 80 A0 C0
U+00FF 00 FF FF 00 C3 BF A0 FF
U+0100 01 00 00 01 C4 80 A1 21
U+015D 01 5D 5D 01 C5 9D A1 7E
U+015E 01 5E 5E 01 C5 9E A1 A0
U+01BD 01 BD BD 01 C6 BD A1 FF
U+01BE 01 BE BE 01 C6 BE A2 21
U+07FF 07 FF FF 07 DF BF AA 72
U+0800 08 00 00 08 E0 A0 80 AA 73
U+0FFF 0F FF FF 0F E0 BF BF B5 48
U+1000 10 00 00 10 E1 80 80 B5 49
U+4015 40 15 15 40 E4 80 95 F5 FF
U+4016 40 16 16 40 E4 80 96 F6 21 21
U+D7FF D7 FF FF D7 ED 9F BF F7 2F C3
U+E000 E0 00 00 E0 EE 80 80 F7 3A 79
U+F8FF F8 FF FF F8 EF A3 BF F7 5C 3C
U+FDD0 FD D0 D0 FD EF B7 90 F7 62 BA
U+FDEF FD EF EF FD EF B7 AF F7 62 D9
U+FEFF FE FF FF FE EF BB BF F7 64 4C
U+FFFD FF FD FD FF EF BF BD F7 65 AD
U+FFFE FF FE FE FF EF BF BE F7 65 AE
U+FFFF FF FF FF FF EF BF BF F7 65 AF
U+10000 D8 00 DC 00 00 D8 00 DC F0 90 80 80 F7 65 B0
U+38E2D D8 A3 DE 2D A3 D8 2D DE F0 B8 B8 AD FB FF FF
U+38E2E D8 A3 DE 2E A3 D8 2E DE F0 B8 B8 AE FC 21 21 21 21
U+FFFFF DB BF DF FF BF DB FF DF F3 BF BF BF FC 21 37 B2 7A
U+100000 DB C0 DC 00 C0 DB 00 DC F4 80 80 80 FC 21 37 B2 7B
U+10FFFF DB FF DF FF FF DB FF DF F4 8F BF BF FC 21 39 6E 6C
U+7FFFFFFF 오류 오류 FD BF BF BF BF BF FD BC 2B B8 40

같이 보기

참고 문헌

  • ISO/IEC JTC 1/SC2/WG2 (1993년 1월 21일). “ISO IR 178: UCS Transformation Format One (UTF-1)” (PDF) (PDF, 256 KB) 1판. Registration number 178. 2015년 3월 18일에 원본 문서 (PDF)에서 보존된 문서. 
  • Czyborra, Roman (1998년 11월 30일). “Unicode Transformation Formats: UTF-8 & Co.”. 2016년 6월 7일에 원본 문서에서 보존된 문서. 2016년 6월 7일에 확인함. 
  • v
  • t
  • e
분류 문자 집합
초기 전기통신
ISO/IEC 8859서지적 이용
  • ANSEL
  • ISO 5426 / 5426-2 / 5427 / 5428 / 6438 / 6861 / 6862 / 10585 / 10586 / 10754 / 11822
  • MARC-8
국가 표준
EUCISO/IEC 2022
MacOS 코드 페이지
("스크립트")
  • 아랍어
  • 켈트어
  • 센트유로
  • ChineseSimp / 확장 유닉스 코드
  • ChineseTrad / Big5
  • 크로아티아어
  • 키릴어
  • 데바나가리
  • 딩뱃
  • 에스페란토
  • 파시
  • 게일어
  • 그리스어
  • 구자라트어
  • 구르무키
  • 히브리어
  • 아이슬란드
  • 일본어 / ShiftJIS
  • 한국어 / 확장 유닉스 코드
  • Latin-1
  • 로마어
  • 루마니아어
  • 사미어
  • 심볼
  • 태국어 / TIS-620
  • 터키어
  • 우크라이나어
도스 코드 페이지
  • 100
  • 111
  • 112
  • 113
  • 151
  • 152
  • 161
  • 162
  • 163
  • 164
  • 165
  • 166
  • 210
  • 220
  • 301
  • 437
  • 449
  • 489
  • 620
  • 667
  • 668
  • 707
  • 708
  • 709
  • 710
  • 711
  • 714
  • 715
  • 720
  • 721
  • 737
  • 768
  • 770
  • 771
  • 772
  • 773
  • 774
  • 775
  • 776
  • 777
  • 778
  • 790
  • 850
  • 851
  • 852
  • 853
  • 854
  • 855/872
  • 856
  • 857
  • 858
  • 859
  • 860
  • 861
  • 862
  • 863
  • 864/17248
  • 865
  • 866/808
  • 867
  • 868
  • 869
  • 874/1161/1162
  • 876
  • 877
  • 878
  • 881
  • 882
  • 883
  • 884
  • 885
  • 891
  • 895
  • 896
  • 897
  • 898
  • 899
  • 900
  • 903
  • 904
  • 906
  • 907
  • 909
  • 910
  • 911
  • 926
  • 927
  • 928
  • 929
  • 932
  • 934
  • 936
  • 938
  • 941
  • 942
  • 943
  • 944
  • 946
  • 947
  • 948
  • 949
  • 950/1370
  • 951
  • 966
  • 991
  • 1034
  • 1039
  • 1040
  • 1041
  • 1042
  • 1043
  • 1044
  • 1046
  • 1086
  • 1088
  • 1092
  • 1093
  • 1098
  • 1108
  • 1109
  • 1114
  • 1115
  • 1116
  • 1117
  • 1118
  • 1119
  • 1125/848
  • 1126
  • 1127
  • 1131/849
  • 1139
  • 1167
  • 1168
  • 1300
  • 1351
  • 1361
  • 1362
  • 1363
  • 1372
  • 1373
  • 1374
  • 1375
  • 1380
  • 1381
  • 1385
  • 1386
  • 1391
  • 1392
  • 1393
  • 1394
  • Kamenicky
  • 마조비아
  • CWI-2
  • KOI8
  • MIK
  • 이란 시스템
IBM AIX 코드 페이지
IBM 애플 매킨토시
에뮬레이터
  • 1275
  • 1280
  • 1281
  • 1282
  • 1283
  • 1284
  • 1285
  • 1286
IBM 어도비 에뮬레이션
  • 1038
  • 1276
  • 1277
IBM DEC 에뮬레이션
  • 1020
  • 1021
  • 1023
  • 1090
  • 1100
  • 1101
  • 1102
  • 1103
  • 1104
  • 1105
  • 1106
  • 1107
  • 1287
  • 1288
IBM HP 에뮬레이션
  • 1050
  • 1051
  • 1052
  • 1053
  • 1054
  • 1055
  • 1056
  • 1057
  • 1058
윈도우 코드 페이지
EBCDIC 코드 페이지
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37/1140
  • 38
  • 39
  • 40
  • 251
  • 252
  • 254
  • 256
  • 257
  • 258
  • 259
  • 260
  • 264
  • 273/1141
  • 274
  • 275
  • 276
  • 277/1142
  • 278/1143
  • 279
  • 280/1144
  • 281
  • 282
  • 283
  • 284/1145
  • 285/1146
  • 286
  • 287
  • 288
  • 289
  • 290
  • 297/1147
  • 298
  • 300
  • 320
  • 321
  • 322
  • 330
  • 352
  • 353
  • 355
  • 357
  • 358
  • 359
  • 360
  • 361
  • 363
  • 382
  • 383
  • 384
  • 385
  • 386
  • 387
  • 388
  • 389
  • 390
  • 391
  • 392
  • 393
  • 394
  • 395
  • 410
  • 420/16804
  • 421
  • 423
  • 424/8616/12712
  • 425
  • 435
  • 500/1148
  • 803
  • 829
  • 833
  • 834
  • 835
  • 836
  • 837
  • 838/838
  • 839
  • 870/1110/1153
  • 871/1149
  • 875/4971/9067
  • 880
  • 881
  • 882
  • 883
  • 884
  • 885
  • 886
  • 887
  • 888
  • 889
  • 890
  • 892
  • 893
  • 905
  • 918
  • 924
  • 930/1390
  • 931
  • 933/1364
  • 935/1388
  • 937/1371
  • 939/1399
  • 1001
  • 1002
  • 1003
  • 1005
  • 1007
  • 1024
  • 1025/1154
  • 1026/1155
  • 1027
  • 1028
  • 1030
  • 1031
  • 1032
  • 1033
  • 1037
  • 1047
  • 1068
  • 1069
  • 1070
  • 1071
  • 1073
  • 1074
  • 1075
  • 1076
  • 1077
  • 1078
  • 1079
  • 1080
  • 1081
  • 1082
  • 1083
  • 1084
  • 1085
  • 1087
  • 1091
  • 1097
  • 1112/1156
  • 1113
  • 1122/1157
  • 1123/1158
  • 1130/1164
  • 1132
  • 1136
  • 1137
  • 1150
  • 1151
  • 1152
  • 1159
  • 1165
  • 1166
  • 1278
  • 1279
  • 1303
  • 1364
  • 1376
  • 1377
  • JEF
  • KEIS
플랫폼 특화
  • 아콘
  • 어도비 표준
  • ATASCII
  • 아타리 ST
  • BICS
  • 카시오 계산기
  • CDC
  • CPC
  • DEC Radix-50
  • DEC MCS/NRCS
  • DG 인터내셔널
  • ELWRO-Junior
  • FIELDATA
  • GEM
  • GEOS
  • GSM 03.38
  • HP Roman 확장
  • HP Roman-8
  • HP Roman-9
  • HP 계산기
  • LICS
  • LMBCS
  • NEC APC
  • NeXT
  • PETSCII
  • 샤프 계산기
  • TI 계산기
  • Ventura International
  • Ventura Symbol
  • WISCII
  • XCCS
  • ZX80
  • ZX81
  • ZX 스펙트럼
유니코드 / ISO/IEC 10646
기타 코드 페이지
  • ABICOMP
  • APL
    • 293
    • 310
    • 351
  • Cork
  • HZ
  • 조합
  • SEASCII
  • TACE16
  • TRON
  • UTF-5
  • UTF-6
  • UTF-8
관련 주제