2
голосов
5ответов
5402 просмотров

Как правильно обрабатывать международные символы в PHP / MySQL / Apache

Мне нужно создать приложение на PHP, которое может обрабатывать все символы Unicode во всех местах - поля редактирования, статический HTML, базу данных.Может кто-нибудь сказать мне полный список всех параметров / функций, которые необходимо установить / использовать для достижения этой цели?

65
голосов
9ответов
42850 просмотров

Получите список всех кодировок, которые Python может кодировать.

Я пишу сценарий, который попытается кодировать байты во множество различных кодировок в Python 2.6.Есть ли способ получить список доступных кодировок, который я могу перебирать? Причина, по которой я пытаюсь это сделать, заключается в том, что у пользователя есть текст, который неправильно за...

29
голосов
11ответов
68802 просмотров

Как скомпилировать исходный файл Java в кодировке «UTF-8»?

Я сохранил исходный файл Java, указав его тип кодировки как UTF-8 (используя Блокнот, по умолчанию тип кодировки Блокнота - ANSI), а затем я попытался скомпилировать его, используя: javac -encoding "UTF-8" One.java но выдает сообщение об ошибке " One.java:1: illegal character: 5279 ?pu...

1
голосов
3ответов
259 просмотров

Проблемы с кодировкой символов на веб-сайте

У меня есть веб-сайт, на котором пользователи со всего мира могут отправлять профили. Где-то между хранением / получением / отображением символов они не отображаются правильно. Я не уверен, на каком этапе возникают проблемы, но вот подробное описание того, что происходит. Когда я делаю SELECT...

6
голосов
4ответов
2871 просмотров

Вывод символов юникода в терминале Windows

На прошлой неделе я работал над roguelike игрой на C ++ вместе с друг. В основном тоже изучаю язык. Я использую: pdcurses Windows 7 Visual Studio C ++ Для вывода wchar_t в любом месте консоли. Мне удалось отменить некоторые символы Юникода, такие как \ u263B (☻), но другие, та...

34
голосов
7ответов
65094 просмотров

preg_match и UTF-8 в PHP

Я пытаюсь найти строку в кодировке UTF8, используя preg_match а>. preg_match('/H/u', "\xC2\xA1Hola!", $a_matches, PREG_OFFSET_CAPTURE); echo $a_matches[0][1]; Должно вывести 1, так как "H" находится в индексе 1 в строке "¡Hola!".Но он печатает 2. Таким образом, похоже, что он не рассм...

0
голосов
1ответов
1796 просмотров

Преобразование строки в Unicode с помощью VB.NET

Как я могу преобразовать греческую строку в Unicode с помощью VB.NET, не зная исходной кодировки?

5
голосов
4ответов
6165 просмотров

Как я могу отображать строки Unicode во время отладки в Linux?

Я уже несколько лет работаю разработчиком C ++ с использованием MS Visual Studio как рабочая платформа. Поскольку я лично предпочитаю использовать Linux, я недавно взял шанс перенести мою рабочую среду на Linux. Поскольку я оптимизирую среду Windows уже несколько лет, конечно, оказывается, что н...

52
голосов
9ответов
67815 просмотров

Как сопоставить кириллические символы с регулярным выражением

Как сопоставить символы русского и французского алфавитов кириллицы с регулярным выражением?Я хочу использовать только буквенные символы, без цифр или специальных символов.Прямо сейчас у меня [А-Я-Я]

7
голосов
3ответов
9459 просмотров

Лучший способ декодировать неизвестную кодировку в Python 2.5

Я все правильно понял?В любом случае, я разбираю много html, но не всегда знаю, в какой кодировке он должен быть (удивительное количество лжи об этом).Приведенный ниже код легко показывает, чем я занимался до сих пор, но я уверен, что есть способ получше.Будем очень признательны за ваши предложе...

0
голосов
2ответов
915 просмотров

Как запустить Django в Windows и справиться с Apache, у которого нет режима демона?

Развитие этого вопроса Это началось как попытка найти другие рекомендации по запуску Django в Linux, доступу к SQL Server через Django-PyODBC и поддержке Unicode так же грамотно, как в установках с Django в Windows. После того, как не удалось реализовать хорошее решение для драйверов ODBC ...

24
голосов
4ответов
14431 просмотров

Что означает «u» в списке?

Я впервые сталкиваюсь с этим.Только что напечатал список, и перед каждым элементом, кажется, стоит u, т.е. [u'hello', u'hi', u'hey'] Что это означает и почему в списке это должно быть перед каждым элементом? Поскольку я не знаю, насколько это распространено, если вы хотите увидеть, к...

0
голосов
2ответов
325 просмотров

Проблемы с кодировкой mysql

Я имею дело с некоторыми внешними API-интерфейсами, и когда я сохраняю данные в базу данных, я получаю некоторые ошибки кодирования. Все содержимое, с которым я имею дело, находится в Юникоде;но кодировка mysql установлена на latin1. Кажется, в моей локальной системе все работает нормально, н...

27
голосов
2ответов
8596 просмотров

Быстрый способ отфильтровать недопустимые символы xml unicode в Python?

В спецификации XML перечислены некоторые символы Unicode, которые либо недопустимы, либо "обескуражен ".Учитывая строку, как я могу удалить из нее все недопустимые символы? Я придумал следующее регулярное выражение, но это немного скучно. illegal_xml_re = re.compile(u'[\x00-\x08\x0b-\x1f...

20
голосов
6ответов
10558 просмотров

Использование перенаправления в сценарии дает вывод в формате Unicode.Как выдать однобайтовый текст ASCII?

Я использую Sandcastle Helpfile Builder для создания файла справки (.chm).Проект представляет собой файл .shfbproj в формате XML, работающий с msbuild. Я хочу автоматически обновлять текст нижнего колонтитула, который появляется в созданном файле .chm.Я использую этот фрагмент: $newFooter...

4
голосов
3ответов
3275 просмотров

Как мне заставить emacs правильно отображать файл с многобайтовой кодировкой?Это мул?

Когда я открываю многобайтовый файл, я получаю следующее:

1
голосов
1ответов
4764 просмотров

java как написать символ юникода 0x13?

как напечатать символ Unicode 0x13 в java ???

8
голосов
2ответов
12890 просмотров

Обнаружение символов Юникода в NSString на iPhone

Я работаю над приложением SMS для iPhone.Мне нужно определить, ввел ли пользователь какие-либо символы Юникода внутри NSString, которые они хотят отправить. Мне нужно это сделать, потому что символы Юникода занимают больше места в сообщении, а также потому, что мне нужно преобразовать их в их ...

0
голосов
1ответов
707 просмотров

Пакет SSIS имеет проблему с преобразованием имени даты (dw, datum) в varchar

Я перемещаю данные в DW с помощью SQL Server SSIS и использую следующий SQL для заполнения одного измерения SELECT DISTINCT cast (datename(dw,datum) as varchar(10)) as veckodag FROM XXXXX.dbo.Bought поскольку у меня есть VARCHAR в целевом столбце, мне нужно CAST / CONVERT Вопрос , ка...

0
голосов
1ответов
671 просмотров

проблемы с отрисовкой индийских шрифтов в приложении C # .NET

Я пытаюсь отобразить строку шрифта телугу в приложении C #.Когда текст отображается с использованием расширенного текстового поля или текстового поля со шрифтом, установленным на «Гаутами» (один из шрифтов, поддерживающих язык телугу), символы не работают. Одна буква, которая должна отображат...

7
голосов
4ответов
912 просмотров

Библиотека строк C

Существует ли библиотека строк C для C (не C ++), которая реализует абстракцию над строками char * и wchar_t *? Требования: иметь лицензию BSD / MIT / CDDL реализует какой-то механизм подсчета ссылок. поддерживает регулярные выражения поддерживает Unicode. Спасибо,

4
голосов
2ответов
599 просмотров

Как новые домены Unicode будут обрабатываться регулярными выражениями электронной почты?

С В октябре 2009 г. в Интернете Корпорация присвоения имен и Numbers (ICANN) одобрил создание доменов верхнего уровня с кодом страны (ccTLD) в Интернете, которые используют Стандарт IDNA для родного языка скрипты. Я почти уверен, что стандартные регулярные выражения, которы...

89
голосов
5ответов
154864 просмотров

Отображение символов юникода в HTML

Я хочу просто отображать символы галочки (✔) и крестика (✘) на HTML-странице, но они отображаются либо в виде прямоугольника, либо в виде кружка ✠»- очевидно, что-то связано с кодировкой. Я установил метатег для отображения utf-8, но, очевидно, что-то не хватает. <meta http-equiv="Con...

2
голосов
1ответов
450 просмотров

Требуется ли префикс N Unicode в SQL Compact Edition?

По крайней мере, в предыдущих версиях SQL Server для строковых констант Юникода нужно было ставить префикс "N", чтобы они обрабатывались как Юникод. Таким образом, select foo from bar where fizz = N'buzz' (См. "Программирование на стороне сервера с помощью Unicode" для SQL Server 2005 "...

2
голосов
6ответов
2122 просмотров

Какая хорошая библиотека для создания PDF-файлов в Delphi 2010?

Какая хорошая библиотека для создания PDF-файлов в Delphi 2010? До Unicode Я использовал PowerPDF, который, хотя и устарел, был достаточно гибким, чтобы делать то, что я хотел (очень настраиваемые отчеты, не основанные на базе данных / таблицах) В настоящее время у меня компилируется Power...

18
голосов
5ответов
19746 просмотров

Рекурсивно изменять кодировку файлов в Windows?

Кто-нибудь знает инструмент, желательно для контекстного меню проводника, для рекурсивного изменения кодировки файлов в проекте с ISO-8859-1 на UTF-8 и другие кодировки?Бесплатное или не слишком дорогое было бы замечательно. Изменить: Спасибо за ответы, +1 за все тогда.Но мне бы очень хотел...

7
голосов
4ответов
4703 просмотров

Есть ли в Delphi эффективная функция поиска по всему слову?

Есть ли в Delphi 2009 или новее (Unicode) какие-либо встроенные функции или небольшие подпрограммы, которые будут выполнять достаточно эффективный поиск по всему слову, в котором вы указываете разделители, определяющие слово, например: function ContainsWord(Word, Str: string): boolean; const...

19
голосов
2ответов
2176 просмотров

Что такое «стандартный порядок сравнения строк» в Perl?

Это действительно двойной вопрос, и у моих двух конечных целей есть ответы на следующие вопросы: Каков стандартный порядок сравнения строк с точки зрения механики? Какое название лучше для этого, чтобы я мог обновлять документы? В документации Perl для sort говорится, что без блока s...

19
голосов
3ответов
4398 просмотров

Почему в Юникоде есть два представления для арабских цифр?

Я читал спецификацию Unicode @ Wikipedia ( арабский Unicode ) и я вижу, что каждая из арабских цифр имеет 2 кодовых точки Unicode. Например, 1 определяется как U + 0661 и как U + 06F1. Какой из них использовать?

0
голосов
3ответов
197 просмотров

Как использовать аргументы Unicode для методов?

У меня есть класс модели с методами получения и установки, а также случайными статическими методами.Я хотел бы принудительно использовать строки Unicode в качестве аргументов для определенных методов, и использование декораторов было моей первой идеей.Теперь у меня что-то вроде этого: import ...