0
голосов
1ответов
1318 просмотров

Regex word-break with unicode diacritics

I am working on an application that searches text using regular expressions based on input from a user. One option the user has is to include a "Match 0 or more characters" wildcard using the asterisk. I need this to only match between word boundaries. My first attempt was to convert all asterisk...

1
голосов
2ответов
208 просмотров

A regular expression for \b

I am writing regular expressions for unicode text in Java. However for the particular script that I am using - Devanagari (0900 - 097F) there is a problem with word boundaries. \b matches characters which are dependent vowels(like 093E-094C) as they are treated like space characters. Example: Su...

138
голосов
12ответов
151216 просмотров

What is a word boundary in regex?

I am using Java regexes in Java 1.6 (to parse numeric output, among other purposes) and cannot find a precise definition of \b ("word boundary"). I had assumed that -12 would be an "integer word" (matched by \b\-?\d+\b) but it appears that this does not work. I'd be grateful to know of ways of ...

1
голосов
3ответов
2700 просмотров

AS3 RegEx для сопоставления слов с символами граничного типа в них

Я хочу составить список слов, что достаточно просто, если эти слова действительно являются словами. Например, /\b (pop|push) \b/gsx при работе со строкой Поп толкнул дверь, но она открылась будет соответствовать словам pop и push, но не всплывать. Мне нужны аналогичные функции для с...

2
голосов
4ответов
4765 просмотров

Поиск слов, начинающихся строго с $, Regex C #

Мне нужно найти все совпадения слова, которое строго начинается с "$" и содержит только цифры. Я написал [$]\d+ что дало мне 4 совпадения для $10 $10 $20a a$20 поэтому я подумал об использовании границ слов с помощью \ b: [$]\d+\b Но опять совпало 20 долларов для меня. ...

27
голосов
5ответов
65269 просмотров

Как сопоставить первое слово после выражения с помощью регулярного выражения?

Например, в этом тексте: Lorem ipsum dolor sit amet, conctetur adipiscing elit. Nunc eu tellus vel nunc pretium lacinia. Proin sed lorem. Cras sed ipsum. Nunc a libero quis risus sollicitudin imperdiet. Я хочу сопоставить слово после "ipsum".