fix bug 3236, 'sc_html_parse_tag() does not recognize '<br/>' as line break'
[claws.git] / src / html.c
index 010cf1203395d822333e926594950428e886bb1a..ff5a61eb3beebca9ef60f9f56947e21712df9a3e 100644 (file)
@@ -440,14 +440,17 @@ static SC_HTMLState sc_html_read_line(SC_HTMLParser *parser)
        gchar buf[SC_HTMLBUFSIZE];
        gchar buf2[SC_HTMLBUFSIZE];
        gint index;
+       gint n;
 
        if (parser->fp == NULL)
                return SC_HTML_EOF;
 
-       if (fgets(buf, sizeof(buf), parser->fp) == NULL) {
+       n = fread(buf, 1, sizeof(buf) - 1, parser->fp);
+       if (n == 0) {
                parser->state = SC_HTML_EOF;
                return SC_HTML_EOF;
-       }
+       } else
+               buf[n] = '\0';
 
        if (conv_convert(parser->conv, buf2, sizeof(buf2), buf) < 0) {
                index = parser->bufp - parser->buf->str;
@@ -640,7 +643,7 @@ static SC_HTMLState sc_html_parse_tag(SC_HTMLParser *parser)
        parser->state = SC_HTML_UNKNOWN;
        if (!tag) return SC_HTML_UNKNOWN;
 
-       if (!strcmp(tag->name, "br")) {
+       if (!strcmp(tag->name, "br") || !strcmp(tag->name, "br/")) {
                parser->space = FALSE;
                sc_html_append_char(parser, '\n');
                parser->state = SC_HTML_BR;
@@ -745,6 +748,22 @@ static void sc_html_parse_special(SC_HTMLParser *parser)
        sc_html_append_str(parser, symbol_name, -1);
 }
 
+static gchar *sc_html_find_tag(SC_HTMLParser *parser, const gchar *tag)
+{
+       gchar *cur = parser->bufp;
+       gint len = strlen(tag);
+
+       if (cur == NULL)
+               return NULL;
+
+       while ((cur = strstr(cur, "<")) != NULL) {
+               if (!g_ascii_strncasecmp(cur, tag, len))
+                       return cur;
+               cur += 2;
+       }
+       return NULL;
+}
+
 static void sc_html_get_parenthesis(SC_HTMLParser *parser, gchar *buf, gint len)
 {
        gchar *p;
@@ -762,14 +781,14 @@ static void sc_html_get_parenthesis(SC_HTMLParser *parser, gchar *buf, gint len)
        }
        if (!g_ascii_strncasecmp(parser->bufp, "<style", 6)) {
                parser->bufp += 6;
-               while ((p = strcasestr(parser->bufp, "</style>")) == NULL)
+               while ((p = sc_html_find_tag(parser, "</style>")) == NULL)
                        if (sc_html_read_line(parser) == SC_HTML_EOF) return;
                parser->bufp = p + 8;
                return;
        }
        if (!g_ascii_strncasecmp(parser->bufp, "<script", 7)) {
                parser->bufp += 7;
-               while ((p = strcasestr(parser->bufp, "</script>")) == NULL)
+               while ((p = sc_html_find_tag(parser, "</script>")) == NULL)
                        if (sc_html_read_line(parser) == SC_HTML_EOF) return;
                parser->bufp = p + 9;
                return;