by:

Ich habe in einem Artikel von der Möglichkeit geschrieben mit
MySQL-Proxy eine lastenverteilte Datenbank aufzubauen.

Heute möchte ich jedoch eine andere Alternative vorstellen.
Ich habe zu diesem Zweck eine Datenbank Lastenverteilungsklasse geschrieben.
Sie stellt drei Methoden zur Lastenverteilung bereit:

Simple Load Balancing verteilt die Last völlig willkürlich:
Vorteil: relativ schnell
Nachteil: Server können einseitig belastet werden

Load Balancing by Weight verteilt die Last nach Gewichtung:
Hat man z.B. eine starke und zwei schwache Maschinen
ist es möglich der starken mehr Gewichtung zu geben.
Nachteil: Der richtige Gewichtungswert von Maschinen ist schwer zu ermittelen
und kann sich im regulären Betrieb unerwartet ändern.

Load Balancing by Load verteilt die Last nach Systemauslastung:
Vorteil: Die Last wird an den Server verteilt, der am wenigsten zu tun hat.
Nachteil: Die zusätzliche Zeit, die benötigt wird, um die Systemlast der Server abzufragen.
Läuft nur unter Linux, benötigt memcache.

Derzeit wird die Systemlast 60 Sekunden im memcache zwischengespeichert um unnötige Anfragen
an den Webserver zu sparen,
evtl. muss dieser Wert angepasst werden, damit unter hoher Last die Maschinen nicht einseitig
belastet werden.


Desweiteren stellt die Klasse eine Methode zum Abfragen der durchschnittlichen Systemlast bereit
und ausserdem eine Methode die endscheiden kann, ob eine Abfrage auf den Master oder Slave laufen soll.


Code


<?
/**
 * DBLoadBalancing implements three different methods for LoadBalancing
 * and one Method for Read / Write Splitting
 *
 * Simple Load Balancing - random dissision
 * Load Balancing by Weight - dissision by weight
 * Load Balancing by Load - dissision by load
 *
 * @todo benchmark and test bevore useing it on productive system
 * @author Andreas Beder <office@codejungle.org>
 * @license http://opensource.org/licenses/gpl-2.0.php GNU Public License
 */
class DBLoadBalancing{

    var $config =array();

    function __construct() {

        //Config for Simple Load Balanncing

        $this->config['slaves']=array("10.0.0.1","10.0.0.2", "10.0.0.3");
        /*
        //Config for Load Balancing by Weight

        $this->config['slaves']=array("10.0.0.1"=>2,"10.0.0.2"=>0, "10.0.0.3"=>1);

        //Config for Load Balancing by Load

        $this->config['slaves']=array(
        "10.0.0.1"=>"http://slave1/getload.php",
        "10.0.0.2"=>"http://slave2/getload.php",
        "10.0.0.3"=>"http://slave3/getload.php"
        );
        $this->config['memcache']=array(
        "localhost"=>"11211",
        "slave2", "11211"
        );
        */
    }

    /**
     * This Method checks if a Query
     * can be run on Master or Slaves
     *
     * @param string $sql
     * @return boolen
     *
     * @author Andreas Beder <office@codejungle.org>
     */

    function ModifingQuery($sql){

        $sql=strtolower(substr($sql, 0, 6));

        switch ($sql) {

            //selects can be run on slaves, because it's not a modifiny query
            case "select":
                return false;
                break;
            //insert, update, delete, alter must be executed on master
            case "default":
                return true;
        }
        return true;
    }

    /**
     * Simple Load Balanncing
     * Just random Load Balancing
     *
     * @return string ip
     *
     * @author Andreas Beder <office@codejungle.org>
     */
    function SimpleLoadBalanncing(){

        $i=count($this->config['slaves'])-1;
        $rand=rand(0, $i);
        return $this->config['slaves'][$rand];
    }

    /**
     * Load Balancing by Weight
     *
     * @return string ip
     *
     * @author Andreas Beder <office@codejungle.org>
     */
    function LoadBalancingByWeight(){

        $i=count($this->config['slaves']);
        foreach($this->config['slaves'] as $server => $weight){
            $rand=rand(1, $i);
            $lb[$server]=$rand+$weight;
        }
        arsort($lb);
        return key($lb);

    }

    /**
     * LoadBalancingByLoad
     *
     * This method checks the load on n server.
     * Cache the result for 60 sec (because we don't want to ask too many times)
     * Finaly it returns the Server ip with the lowest load
     *
     * @return string ip
     *
     * @author Andreas Beder <office@codejungle.org>
     */
    function LoadBalancingByLoad() {

        $memcache = new Memcache;
        foreach($this->config['memcache'] as $memcahe_server => $port){
            $memcache->addServer($memcahe_server, $port);
        }

        foreach($this->config['slaves'] as $server => $checkloadurl){
            if($memcache->get($server)){
                $load[$server]=$memcache->get($server);
            }
            else
            {
                $curl = curl_init();
                curl_setopt($curl, CURLOPT_URL, $checkloadurl);
                curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
                $output = curl_exec($curl);
                $memcache->set($memcache, $server, $output, 0, 60);
                $load[$server]=$output;
                curl_close($curl);
            }
        }
        asort($load);
        return key($load);
    }

    /**
     * Get Load simply returns the laod average
     * from the last minute
     *
     * @return float load avg
     *
     * @author Andreas Beder <office@codejungle.org>
     */
    function GetLoad(){
        $load=sys_getloadavg();
        return $load[0];
    }
}

?>


Ich habe versucht die Methoden so generisch zu schreiben, dass man sie auch für andere
Lastenverteilung nutzen kann.
Es ist ebenso denkbar, gewisse Methoden zu kombinieren.

Ich hoffe euch hat mein kleiner Artikel zur Lastenverteilung gefallen,
über Feedback würd' ich mich wie immer sehr freuen.

Eine Warnung noch zum Schluss, bitte verwendet die Klasse nicht ohne gezieltes
Benchmarking und Testing im Produktivsystem.


LG

Andreas