Update list of recognised TLDs to current
authorRicardo Mones <ricardo@mones.org>
Thu, 12 Nov 2015 16:32:29 +0000 (17:32 +0100)
committerRicardo Mones <ricardo@mones.org>
Thu, 12 Nov 2015 16:32:29 +0000 (17:32 +0100)
Using the script in previous commit :-)

src/common/Makefile.am
src/common/tlds.h [new file with mode: 0644]
src/common/utils.c

index 161922652c62eec11ecbc316c9f2c3315469e7a9..6551157b323dad9999d5d14104a00f24b900ca95 100644 (file)
@@ -67,6 +67,7 @@ clawscommoninclude_HEADERS = $(arch_headers) \
        tags.h \
        template.h \
        timing.h \
+       tlds.h \
        utils.h \
        uuencode.h \
        version.h \
diff --git a/src/common/tlds.h b/src/common/tlds.h
new file mode 100644 (file)
index 0000000..c37f1b9
--- /dev/null
@@ -0,0 +1,212 @@
+/*
+ * This is a generated file.
+ * See tools/claws.get.tlds.pl
+ */
+#ifndef __TLDS_H__
+#define __TLDS_H__
+
+static const gchar *toplvl_domains [] = {
+       /* Version 2015111201, Last Updated Thu Nov 12 07:07:01 2015 UTC */
+       "aaa", "aarp", "abb", "abbott", "abogado",
+       "ac", "academy", "accenture", "accountant", "accountants",
+       "aco", "active", "actor", "ad", "ads",
+       "adult", "ae", "aeg", "aero", "af",
+       "afl", "ag", "agency", "ai", "aig",
+       "airforce", "airtel", "al", "allfinanz", "alsace",
+       "am", "amica", "amsterdam", "android", "ao",
+       "apartments", "app", "apple", "aq", "aquarelle",
+       "ar", "aramco", "archi", "army", "arpa",
+       "arte", "as", "asia", "associates", "at",
+       "attorney", "au", "auction", "audio", "auto",
+       "autos", "aw", "ax", "axa", "az",
+       "azure", "ba", "band", "bank", "bar",
+       "barcelona", "barclaycard", "barclays", "bargains", "bauhaus",
+       "bayern", "bb", "bbc", "bbva", "bcn",
+       "bd", "be", "beats", "beer", "bentley",
+       "berlin", "best", "bet", "bf", "bg",
+       "bh", "bharti", "bi", "bible", "bid",
+       "bike", "bing", "bingo", "bio", "biz",
+       "bj", "black", "blackfriday", "bloomberg", "blue",
+       "bm", "bms", "bmw", "bn", "bnl",
+       "bnpparibas", "bo", "boats", "bom", "bond",
+       "boo", "boots", "boutique", "br", "bradesco",
+       "bridgestone", "broker", "brother", "brussels", "bs",
+       "bt", "budapest", "build", "builders", "business",
+       "buzz", "bv", "bw", "by", "bz",
+       "bzh", "ca", "cab", "cafe", "cal",
+       "camera", "camp", "cancerresearch", "canon", "capetown",
+       "capital", "car", "caravan", "cards", "care",
+       "career", "careers", "cars", "cartier", "casa",
+       "cash", "casino", "cat", "catering", "cba",
+       "cbn", "cc", "cd", "ceb", "center",
+       "ceo", "cern", "cf", "cfa", "cfd",
+       "cg", "ch", "chanel", "channel", "chat",
+       "cheap", "chloe", "christmas", "chrome", "church",
+       "ci", "cipriani", "cisco", "citic", "city",
+       "cityeats", "ck", "cl", "claims", "cleaning",
+       "click", "clinic", "clothing", "cloud", "club",
+       "clubmed", "cm", "cn", "co", "coach",
+       "codes", "coffee", "college", "cologne", "com",
+       "commbank", "community", "company", "computer", "condos",
+       "construction", "consulting", "contractors", "cooking", "cool",
+       "coop", "corsica", "country", "coupons", "courses",
+       "cr", "credit", "creditcard", "creditunion", "cricket",
+       "crown", "crs", "cruises", "csc", "cu",
+       "cuisinella", "cv", "cw", "cx", "cy",
+       "cymru", "cyou", "cz", "dabur", "dad",
+       "dance", "date", "dating", "datsun", "day",
+       "dclk", "de", "deals", "degree", "delivery",
+       "dell", "delta", "democrat", "dental", "dentist",
+       "desi", "design", "dev", "diamonds", "diet",
+       "digital", "direct", "directory", "discount", "dj",
+       "dk", "dm", "dnp", "do", "docs",
+       "dog", "doha", "domains", "doosan", "download",
+       "drive", "durban", "dvag", "dz", "earth",
+       "eat", "ec", "edu", "education", "ee",
+       "eg", "email", "emerck", "energy", "engineer",
+       "engineering", "enterprises", "epson", "equipment", "er",
+       "erni", "es", "esq", "estate", "et",
+       "eu", "eurovision", "eus", "events", "everbank",
+       "exchange", "expert", "exposed", "express", "fage",
+       "fail", "faith", "family", "fan", "fans",
+       "farm", "fashion", "feedback", "ferrero", "fi",
+       "film", "final", "finance", "financial", "firmdale",
+       "fish", "fishing", "fit", "fitness", "fj",
+       "fk", "flights", "florist", "flowers", "flsmidth",
+       "fly", "fm", "fo", "foo", "football",
+       "forex", "forsale", "forum", "foundation", "fr",
+       "frl", "frogans", "fund", "furniture", "futbol",
+       "fyi", "ga", "gal", "gallery", "game",
+       "garden", "gb", "gbiz", "gd", "gdn",
+       "ge", "gea", "gent", "genting", "gf",
+       "gg", "ggee", "gh", "gi", "gift",
+       "gifts", "gives", "giving", "gl", "glass",
+       "gle", "global", "globo", "gm", "gmail",
+       "gmo", "gmx", "gn", "gold", "goldpoint",
+       "golf", "goo", "goog", "google", "gop",
+       "gov", "gp", "gq", "gr", "graphics",
+       "gratis", "green", "gripe", "group", "gs",
+       "gt", "gu", "gucci", "guge", "guide",
+       "guitars", "guru", "gw", "gy", "hamburg",
+       "hangout", "haus", "healthcare", "help", "here",
+       "hermes", "hiphop", "hitachi", "hiv", "hk",
+       "hm", "hn", "hockey", "holdings", "holiday",
+       "homedepot", "homes", "honda", "horse", "host",
+       "hosting", "hoteles", "hotmail", "house", "how",
+       "hr", "hsbc", "ht", "hu", "hyundai",
+       "ibm", "icbc", "ice", "icu", "id",
+       "ie", "ifm", "iinet", "il", "im",
+       "immo", "immobilien", "in", "industries", "infiniti",
+       "info", "ing", "ink", "institute", "insure",
+       "int", "international", "investments", "io", "ipiranga",
+       "iq", "ir", "irish", "is", "ist",
+       "istanbul", "it", "itau", "iwc", "jaguar",
+       "java", "jcb", "je", "jetzt", "jewelry",
+       "jlc", "jll", "jm", "jo", "jobs",
+       "joburg", "jp", "jprs", "juegos", "kaufen",
+       "kddi", "ke", "kg", "kh", "ki",
+       "kia", "kim", "kinder", "kitchen", "kiwi",
+       "km", "kn", "koeln", "komatsu", "kp",
+       "kr", "krd", "kred", "kw", "ky",
+       "kyoto", "kz", "la", "lacaixa", "lancaster",
+       "land", "landrover", "lasalle", "lat", "latrobe",
+       "law", "lawyer", "lb", "lc", "lds",
+       "lease", "leclerc", "legal", "lexus", "lgbt",
+       "li", "liaison", "lidl", "life", "lifestyle",
+       "lighting", "limited", "limo", "linde", "link",
+       "live", "lixil", "lk", "loan", "loans",
+       "lol", "london", "lotte", "lotto", "love",
+       "lr", "ls", "lt", "ltd", "ltda",
+       "lu", "lupin", "luxe", "luxury", "lv",
+       "ly", "ma", "madrid", "maif", "maison",
+       "man", "management", "mango", "market", "marketing",
+       "markets", "marriott", "mba", "mc", "md",
+       "me", "media", "meet", "melbourne", "meme",
+       "memorial", "men", "menu", "meo", "mg",
+       "mh", "miami", "microsoft", "mil", "mini",
+       "mk", "ml", "mm", "mma", "mn",
+       "mo", "mobi", "moda", "moe", "moi",
+       "mom", "monash", "money", "montblanc", "mormon",
+       "mortgage", "moscow", "motorcycles", "mov", "movie",
+       "movistar", "mp", "mq", "mr", "ms",
+       "mt", "mtn", "mtpc", "mtr", "mu",
+       "museum", "mutuelle", "mv", "mw", "mx",
+       "my", "mz", "na", "nadex", "nagoya",
+       "name", "navy", "nc", "ne", "nec",
+       "net", "netbank", "network", "neustar", "new",
+       "news", "nexus", "nf", "ng", "ngo",
+       "nhk", "ni", "nico", "ninja", "nissan",
+       "nl", "no", "nokia", "np", "nr",
+       "nra", "nrw", "ntt", "nu", "nyc",
+       "nz", "obi", "office", "okinawa", "om",
+       "omega", "one", "ong", "onl", "online",
+       "ooo", "oracle", "orange", "org", "organic",
+       "osaka", "otsuka", "ovh", "pa", "page",
+       "panerai", "paris", "partners", "parts", "party",
+       "pe", "pet", "pf", "pg", "ph",
+       "pharmacy", "philips", "photo", "photography", "photos",
+       "physio", "piaget", "pics", "pictet", "pictures",
+       "ping", "pink", "pizza", "pk", "pl",
+       "place", "play", "playstation", "plumbing", "plus",
+       "pm", "pn", "pohl", "poker", "porn",
+       "post", "pr", "praxi", "press", "pro",
+       "prod", "productions", "prof", "properties", "property",
+       "protection", "ps", "pt", "pub", "pw",
+       "py", "qa", "qpon", "quebec", "racing",
+       "re", "realtor", "realty", "recipes", "red",
+       "redstone", "rehab", "reise", "reisen", "reit",
+       "ren", "rent", "rentals", "repair", "report",
+       "republican", "rest", "restaurant", "review", "reviews",
+       "rich", "ricoh", "rio", "rip", "ro",
+       "rocher", "rocks", "rodeo", "rs", "rsvp",
+       "ru", "ruhr", "run", "rw", "rwe",
+       "ryukyu", "sa", "saarland", "sakura", "sale",
+       "samsung", "sandvik", "sandvikcoromant", "sanofi", "sap",
+       "sapo", "sarl", "saxo", "sb", "sbs",
+       "sc", "sca", "scb", "schmidt", "scholarships",
+       "school", "schule", "schwarz", "science", "scor",
+       "scot", "sd", "se", "seat", "security",
+       "seek", "sener", "services", "seven", "sew",
+       "sex", "sexy", "sg", "sh", "shiksha",
+       "shoes", "show", "shriram", "si", "singles",
+       "site", "sj", "sk", "ski", "sky",
+       "skype", "sl", "sm", "sn", "sncf",
+       "so", "soccer", "social", "software", "sohu",
+       "solar", "solutions", "sony", "soy", "space",
+       "spiegel", "spreadbetting", "sr", "srl", "st",
+       "stada", "starhub", "statoil", "stc", "stcgroup",
+       "stockholm", "studio", "study", "style", "su",
+       "sucks", "supplies", "supply", "support", "surf",
+       "surgery", "suzuki", "sv", "swatch", "swiss",
+       "sx", "sy", "sydney", "systems", "sz",
+       "taipei", "tatamotors", "tatar", "tattoo", "tax",
+       "taxi", "tc", "td", "team", "tech",
+       "technology", "tel", "telefonica", "temasek", "tennis",
+       "tf", "tg", "th", "thd", "theater",
+       "theatre", "tickets", "tienda", "tips", "tires",
+       "tirol", "tj", "tk", "tl", "tm",
+       "tn", "to", "today", "tokyo", "tools",
+       "top", "toray", "toshiba", "tours", "town",
+       "toyota", "toys", "tr", "trade", "trading",
+       "training", "travel", "trust", "tt", "tui",
+       "tv", "tw", "tz", "ua", "ubs",
+       "ug", "uk", "university", "uno", "uol",
+       "us", "uy", "uz", "va", "vacations",
+       "vana", "vc", "ve", "vegas", "ventures",
+       "versicherung", "vet", "vg", "vi", "viajes",
+       "video", "villas", "vin", "virgin", "vision",
+       "vista", "vistaprint", "viva", "vlaanderen", "vn",
+       "vodka", "vote", "voting", "voto", "voyage",
+       "vu", "wales", "walter", "wang", "watch",
+       "webcam", "website", "wed", "wedding", "weir",
+       "wf", "whoswho", "wien", "wiki", "williamhill",
+       "win", "windows", "wine", "wme", "work",
+       "works", "world", "ws", "wtc", "wtf",
+       "xbox", "xerox", "xin", "xperia", "xxx",
+       "xyz", "yachts", "yamaxun", "yandex", "ye",
+       "yodobashi", "yoga", "yokohama", "youtube", "yt",
+       "za", "zara", "zip", "zm", "zone",
+       "zuerich", "zw"
+};
+
+#endif
index d67017ac4e4ab98a45f150127dfa3ba90eac23db..d85eab36f4000bfaf5274a40b3180088a4980354 100644 (file)
@@ -82,6 +82,7 @@
 #include "utils.h"
 #include "socket.h"
 #include "../codeconv.h"
+#include "tlds.h"
 
 #define BUFFSIZE       8192
 
@@ -4227,35 +4228,6 @@ gchar *make_uri_string(const gchar *bp, const gchar *ep)
 
 static GHashTable *create_domain_tab(void)
 {
-       static const gchar *toplvl_domains [] = {
-           "museum", "aero",
-           "arpa", "coop", "info", "name", "biz", "com", "edu", "gov",
-           "int", "mil", "net", "org", "ac", "ad", "ae", "af", "ag",
-           "ai", "al", "am", "an", "ao", "aq", "ar", "as", "at", "au",
-           "aw", "az", "ba", "bb", "bd", "be", "bf", "bg", "bh", "bi",
-           "bj", "bm", "bn", "bo", "br", "bs", "bt", "bv", "bw", "by",
-           "bz", "ca", "cc", "cd", "cf", "cg", "ch", "ci", "ck", "cl",
-           "cm", "cn", "co", "cr", "cu", "cv", "cx", "cy", "cz", "de",
-           "dj", "dk", "dm", "do", "dz", "ec", "ee", "eg", "eh", "er",
-           "es", "et", "eu", "fi", "fj", "fk", "fm", "fo", "fr", "ga", "gd",
-           "ge", "gf", "gg", "gh", "gi", "gl", "gm", "gn", "gp", "gq",
-           "gr", "gs", "gt", "gu", "gw", "gy", "hk", "hm", "hn", "hr",
-           "ht", "hu", "id", "ie", "il", "im", "in", "io", "iq", "ir",
-           "is", "it", "je", "jm", "jo", "jp", "ke", "kg", "kh", "ki",
-           "km", "kn", "kp", "kr", "kw", "ky", "kz", "la", "lb", "lc",
-           "li", "lk", "lr", "ls", "lt", "lu", "lv", "ly", "ma", "mc",
-           "md", "mg", "mh", "mk", "ml", "mm", "mn", "mo", "mp", "mq",
-           "mr", "ms", "mt", "mu", "mv", "mw", "mx", "my", "mz", "na",
-           "nc", "ne", "nf", "ng", "ni", "nl", "no", "np", "nr", "nu",
-           "nz", "om", "pa", "pe", "pf", "pg", "ph", "pk", "pl", "pm",
-           "pn", "pr", "ps", "pt", "pw", "py", "qa", "re", "ro", "ru",
-           "rw", "sa", "sb", "sc", "sd", "se", "sg", "sh", "si", "sj",
-           "sk", "sl", "sm", "sn", "so", "sr", "st", "sv", "sy", "sz",
-           "tc", "td", "tf", "tg", "th", "tj", "tk", "tm", "tn", "to",
-           "tp", "tr", "tt", "tv", "tw", "tz", "ua", "ug", "uk", "um",
-           "us", "uy", "uz", "va", "vc", "ve", "vg", "vi", "vn", "vu",
-           "wf", "ws", "ye", "yt", "yu", "za", "zm", "zw"
-       };
        gint n;
        GHashTable *htab = g_hash_table_new(g_stricase_hash, g_stricase_equal);