自动生成文章摘要的代码[PHP 版本](2)


function Generate_Brief($text){ 
  global $Briefing_Length; 
  mb_regex_encoding("UTF-8"); 
  if(mb_strlen($text) <= BRIEF_LENGTH ) return $text;    
  $Foremost = mb_substr($text, 0, BRIEF_LENGTH); 
  $re = "<(\/?)(P|DIV|H1|H2|H3|H4|H5|H6|ADDRESS|PRE|TABLE|TR|TD|TH|INPUT|SELECT|TEXTAREA|OBJECT|A|UL|OL|LI|BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT|SPAN)[^>]*(>?)"; 
  $Single = "/BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT|BR/i";    
  $Stack = array(); $posStack = array(); 
  mb_ereg_search_init($Foremost, $re, 'i'); 
  while($pos = mb_ereg_search_pos()){ 
    $match = mb_ereg_search_getregs(); 
    /*   [Child-matching Formulation]: 
        $matche[1] : A "https://www.jb51.net/" charactor indicating whether current "<...>" Friction is Closing Part 
        $matche[2] : Element Name. 
        $matche[3] : Right > of a "<...>" Friction    
    */ 
    if($match[1]==""){ 
        $Elem = $match[2]; 
        if(mb_eregi($Single, $Elem) && $match[3] !=""){ 
          continue; 
        } 
        array_push($Stack, mb_strtoupper($Elem)); 
        array_push($posStack, $pos[0]);          
    }else{ 
        $StackTop = $Stack[count($Stack)-1]; 
        $End = mb_strtoupper($match[2]); 
        if(strcasecmp($StackTop,$End)==0){ 
          array_pop($Stack); 
          array_pop($posStack); 
          if($match[3] ==""){ 
            $Foremost = $Foremost.">"; 
          } 
        } 
    } 
  } 
  $cutpos = array_shift($posStack) - 1;    
  $Foremost = mb_substr($Foremost,0,$cutpos,"UTF-8"); 
  return $Foremost; 
}; 

您可能感兴趣的文章:

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/ddce552a1f5a8e97b9b3771706c17a58.html