[gnumeric] handle unicode signs better

From: Morten Welinder <mortenw src gnome org>
To: commits-list gnome org
Cc:
Subject: [gnumeric] handle unicode signs better
Date: Sun, 25 Dec 2011 20:42:45 +0000 (UTC)
commit 7902455bd586f34f46c1675df02c84e1e61a100f
Author: Morten Welinder <terra gnome org>
Date:   Sun Dec 25 15:42:19 2011 -0500

    handle unicode signs better

 ChangeLog    |    5 +++
 src/gutils.c |  100 +++++++++++++++++++++++++++++++++++++++++++++++-----------
 2 files changed, 86 insertions(+), 19 deletions(-)
---
diff --git a/ChangeLog b/ChangeLog
index db19aaa..b542992 100644
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,3 +1,8 @@
+2011-12-25  Morten Welinder  <terra gnome org>
+
+	* src/gutils.c (map_nonascii_digits): Map signs too.  Terminate
+	search/translation no later than third sign.
+
 2011-12-23  Morten Welinder  <terra gnome org>
 
 	* src/gutils.c (gnm_strto): New function that handles non-ascii
diff --git a/src/gutils.c b/src/gutils.c
index e920561..9bcdaef 100644
--- a/src/gutils.c
+++ b/src/gutils.c
@@ -175,35 +175,97 @@ gnm_usr_dir (gboolean versioned)
 	return versioned ? gnumeric_usr_dir : gnumeric_usr_dir_unversioned;
 }
 
+static gboolean
+valid_number_char (char c)
+{
+	/* Assuming digits and signs already mapped.  EXCLUDES decimal point */
+	switch (c) {
+	case '0': case '1': case '2': case '3': case '4':
+	case '5': case '6': case '7': case '8': case '9':
+	case '+': case '-':
+	case 'e': case 'E':
+		return TRUE;
+	default:
+		return FALSE;
+	}
+}
+
+
+
 static char *
 map_nonascii_digits (const char *s)
 {
 	const char *p;
+	GString *res;
+	char *d;
+	/* No valid number can extend beyond the third sign.  */
+	int signs = 0;
+	GString const *decimal = go_locale_get_decimal ();
 
 	for (p = s; *p; p = g_utf8_next_char (p)) {
 		gunichar uc = g_utf8_get_char (p);
-		if (uc > 127 && g_unichar_isdigit (uc)) {
-			GString *res = g_string_new (s);
-			char *d = res->str + (p - s);
-			p = d;
-
-			while (*p) {
-				gunichar uc = g_utf8_get_char (p);
-				const char *next = g_utf8_next_char (p);
-				if (uc > 127 && g_unichar_isdigit (uc)) {
-					*d++ = '0' + g_unichar_digit_value (uc);
-				} else {
-					g_memmove (d, p, next - p);
-					d += (next - p);
-				}
-				p = next;
-			}
-			g_string_truncate (res, d - res->str);
-			return g_string_free (res, FALSE);
+		if (uc <= 127) {
+			if (uc == '+' || uc == '-') {
+				signs++;
+				if (signs == 3)
+					return NULL;
+			} else if (decimal->len == 1 &&
+				   *decimal->str == (char)uc)
+				; /* Nothing */
+			else if (!valid_number_char (uc))
+				return NULL;
+		} else {
+			if (g_unichar_isdigit (uc))
+				break;
+
+			if (go_unichar_issign (uc))
+				break;
+
+			if (strncmp (decimal->str, p, decimal->len) == 0)
+				continue;
+
+			/* Strange unicode; number ends here.  */
+			return NULL;
+		}
+	}
+
+	if (*p == 0)
+		return NULL;
+
+	res = g_string_new (s);
+	d = res->str + (p - s);
+	p = d;
+
+	while (*p) {
+		gunichar uc = g_utf8_get_char (p);
+		const char *next = g_utf8_next_char (p);
+		if (uc <= 127) {
+			*d++ = *p;
+			if (uc == '+' || uc == '-') {
+				signs++;
+				if (signs == 3)
+					break;
+			} else if (decimal->len == 1 &&
+				   *decimal->str == (char)uc)
+				; /* Nothing */
+			else if (!valid_number_char (uc))
+				break;
+		} else if (g_unichar_isdigit (uc)) {
+			*d++ = '0' + g_unichar_digit_value (uc);
+		} else if (go_unichar_issign (uc)) {
+			*d++ = "-/+"[1 + go_unichar_issign (uc)];
+			signs++;
+			if (signs == 3)
+				break;
+		} else {
+			g_memmove (d, p, next - p);
+			d += (next - p);
 		}
+		p = next;
 	}
 
-	return NULL;
+	g_string_truncate (res, d - res->str);
+	return g_string_free (res, FALSE);
 }
 
 /* Like gnm_strto_base, but handling non-ascii digits.  */
[Date Prev][Date Next] [Thread Prev][Thread Next] [Thread Index] [Date Index] [Author Index]