Wat is een goede reguliere expressie die overeenkomt met een URL?

Momenteel heb ik een invoervak dat de URL zal detecteren en de gegevens zal ontleden.

Dus op dit moment gebruik ik:

var urlR = /^(?:([A-Za-z]+):)?(\/{0,3})([0-9.\-A-Za-z]+)
      (?::(\d+))?(?:\/([^?#]*))?(?:\?([^#]*))?(?:#(.*))?$/;
var url= content.match(urlR);

Het probleem is dat wanneer ik een URL invoer zoals www.google.com, deze niet werkt. toen ik http://www.google.cominvoerde, werkte het.

Ik ben niet erg vloeiend in reguliere expressies. Kan iemand me helpen?


Antwoord 1, autoriteit 100%

Regex als u ervoor wilt zorgen dat de URL begint met HTTP/HTTPS:

https?:\/\/(www\.)?[[email protected]:%._\+~#=]{1,256}\.[a-zA-Z0-9()]{1,6}\b([-a-zA-Z0-9()@:%_\+.~#?&//=]*)

Als u geen HTTP-protocol nodig heeft:

[[email protected]:%._\+~#=]{1,256}\.[a-zA-Z0-9()]{1,6}\b([-a-zA-Z0-9()@:%_\+.~#?&//=]*)

Om dit uit te proberen, zie http://regexr.com?37i6s, of voor een versie die minder is beperkende http://regexr.com/3e6m0.

Voorbeeld JavaScript-implementatie:

var expression = /[[email protected]:%._\+~#=]{1,256}\.[a-zA-Z0-9()]{1,6}\b([-a-zA-Z0-9()@:%_\+.~#?&//=]*)?/gi;
var regex = new RegExp(expression);
var t = 'www.google.com';
if (t.match(regex)) {
 alert("Successful match");
} else {
 alert("No match");
}

Antwoord 2, autoriteit 39%

(https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9][a-zA-Z0-9-]+[a-zA-Z0-9]\.[^\s]{2,}|www\.[a-zA-Z0-9][a-zA-Z0-9-]+[a-zA-Z0-9]\.[^\s]{2,}|https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9]+\.[^\s]{2,}|www\.[a-zA-Z0-9]+\.[^\s]{2,})

Komt overeen met de volgende gevallen

 • http://www.foufos.gr
 • https://www.foufos.gr
 • http://foufos.gr
 • http://www.foufos.gr/kino
 • http://werer.gr
 • www.foufos.gr
 • www.mp3.com
 • www.t.co
 • http://t.co
 • http://www.t.co
 • https://www.t.co
 • www.aa.com
 • http://aa.com
 • http://www.aa.com
 • https://www.aa.com

Komt NIET overeen met het volgende

 • www.foufos
 • www.foufos-.gr
 • www.-foufos.gr
 • foufos.gr
 • http://www.foufos
 • http://foufos
 • www.mp3#.com
var expression = /(https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9][a-zA-Z0-9-]+[a-zA-Z0-9]\.[^\s]{2,}|www\.[a-zA-Z0-9][a-zA-Z0-9-]+[a-zA-Z0-9]\.[^\s]{2,}|https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9]+\.[^\s]{2,}|www\.[a-zA-Z0-9]+\.[^\s]{2,})/gi;
var regex = new RegExp(expression);
var check = [
 'http://www.foufos.gr',
 'https://www.foufos.gr',
 'http://foufos.gr',
 'http://www.foufos.gr/kino',
 'http://werer.gr',
 'www.foufos.gr',
 'www.mp3.com',
 'www.t.co',
 'http://t.co',
 'http://www.t.co',
 'https://www.t.co',
 'www.aa.com',
 'http://aa.com',
 'http://www.aa.com',
 'https://www.aa.com',
 'www.foufos',
 'www.foufos-.gr',
 'www.-foufos.gr',
 'foufos.gr',
 'http://www.foufos',
 'http://foufos',
 'www.mp3#.com'
];
check.forEach(function(entry) {
 if (entry.match(regex)) {
  $("#output").append( "<div >Success: " + entry + "</div>" );
 } else {
  $("#output").append( "<div>Fail: " + entry + "</div>" );
 }
});
<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>
<div id="output"></div>

Antwoord 3, autoriteit 7%

Dit zijn de droids die je zoekt. Dit is afkomstig van validator.js, de bibliotheek die u hier echt voor moet gebruiken. Maar wie ben ik om je tegen te houden als je je eigen rol wilt spelen? Als je pure regex wilt, kun je gewoon de lengtecontrole verwijderen. Ik denk dat het echter een goed idee is om de lengte van de URL te testen als je echt wilt weten of je aan de specificaties voldoet.

function isURL(str) {
   var urlRegex = '^(?!mailto:)(?:(?:http|https|ftp)://)(?:\\S+(?::\\S*)[email protected])?(?:(?:(?:[1-9]\\d?|1\\d\\d|2[01]\\d|22[0-3])(?:\\.(?:1?\\d{1,2}|2[0-4]\\d|25[0-5])){2}(?:\\.(?:[0-9]\\d?|1\\d\\d|2[0-4]\\d|25[0-4]))|(?:(?:[a-z\\u00a1-\\uffff0-9]+-?)*[a-z\\u00a1-\\uffff0-9]+)(?:\\.(?:[a-z\\u00a1-\\uffff0-9]+-?)*[a-z\\u00a1-\\uffff0-9]+)*(?:\\.(?:[a-z\\u00a1-\\uffff]{2,})))|localhost)(?::\\d{2,5})?(?:(/|\\?|#)[^\\s]*)?$';
   var url = new RegExp(urlRegex, 'i');
   return str.length < 2083 && url.test(str);
}

Antwoord 4, Autoriteit 4%

Een andere mogelijke oplossing, bovenstaande oplossing is mislukt voor mij in paringen van query-string params.

var regex = new RegExp("^(http[s]?:\\/\\/(www\\.)?|ftp:\\/\\/(www\\.)?|www\\.){1}([0-9A-Za-z-\\[email protected]:%_\+~#=]+)+((\\.[a-zA-Z]{2,3})+)(/(.)*)?(\\?(.)*)?");
if(regex.test("http://google.com")){
 alert("Successful match");
}else{
 alert("No match");
}

In deze oplossing, aarzel dan niet om [-0-9A-Za-z\[email protected]:%_\+~#=te wijzigen, om overeen te komen met de domein / subdomeinnaam. In deze oplossingsoppervlakte-parameters worden ook verzorgd.

Als u niet RegExgebruikt, vervangt u van de uitdrukking \\door \.

Ik hoop dat dit helpt.


Antwoord 5

Ik probeerde wat JavaScript samen te stellen om een ​​domeinnaam (ex. google.com) te valideren en als het valideert een verzendknop inschakelen. Ik dacht dat ik mijn code zou delen voor degenen die op zoek zijn om iets dergelijks te bereiken. Het verwacht een domein zonder HTTP: // of www. waarde. Het script gebruikt een gestripte reguliere expressie van hierboven voor domeinmatching, die niet streng is aan Fake TLD.

http://jsfiddle.net/nmvds/1/

$(function () {
 $('#whitelist_add').keyup(function () {
  if ($(this).val() == '') { //Check to see if there is any text entered
    //If there is no text within the input, disable the button
    $('.whitelistCheck').attr('disabled', 'disabled');
  } else {
    // Domain name regular expression
    var regex = new RegExp("^([0-9A-Za-z-\\[email protected]:%_\+~#=]+)+((\\.[a-zA-Z]{2,3})+)(/(.)*)?(\\?(.)*)?");
    if (regex.test($(this).val())) {
      // Domain looks OK
      //alert("Successful match");
      $('.whitelistCheck').removeAttr('disabled');
    } else {
      // Domain is NOT OK
      //alert("No match");
      $('.whitelistCheck').attr('disabled', 'disabled');
    }
  }
 });
});

HTML-FORMULIER:

<form action="domain_management.php" method="get">
  <input type="text" name="whitelist_add" id="whitelist_add" placeholder="domain.com">
  <button type="submit" class="btn btn-success whitelistCheck" disabled='disabled'>Add to Whitelist</button>
</form>

Other episodes