Другие ресурсы
перила деревянные, ограждения для поликлиник
специалист по информационным технологиям тут. специалист по информационным технологиям

Архив рубрики: ‘Первые шаги’

Регулярные выражения в PHP или как я прикручивал мануал (часть 1)

Долго думал стоит ли начинать писать статью на данную тему…и в конце концов решил почему нет? Я не очень хорошо знаю регулярные выражения, но то что у меня уже получилось-этим я могу поделиться с читателями. Заранее просьба к гуру, давно и хорошо знающим регулярки не ругать сильно данную статью и просто если есть возможность указать на недочеты. Ну это была преамбула. Приступим.
Я давно хотел прикрутить на мой блог PHP мануал в формате html дабы проще было ссылаться на различные функции. Но все как-то руки не доходили. И вот наконец-то вырвался из рутины и решил, что надо просто сесть и написать.
Просто вставить php мануал на сайт было не интересно да и просто стремно. Ведь ман был без дизайна, обычные белые страницы. Мне нужно было интегрировать его в CMS. Тут же я столкнулся с первой проблемой: я никогда не ковырялся в коде WordPress, ну вот не довелось как-то. Ну, что нам стоит дом построить, нарисуем будем жить. :) Дабы сэкономить свое время, я ведь не собираюсь досконально изучать данную систему чтобы постоянно писать под нее плагины, я просто взял несколько плагинов, которые уже были подключены у меня и отлично работали и стал разбираться как же там все устроено. Оказалось все достаточно просто. Ну описывать что и как там я не буду. Ибо статья посвящена не этому(но в дальнейшем обязательно все опишу ;) ). Итак есть мануал, в html форме, есть желание прикрутить его на сайт, и мы разобрались как устроен WP(ну это конечно громко сказано, но все же).
Во первых я решил что в $_SERVER['QUERY_STRING'] будет содержаться имя файла к которому в данный момент обращается пользователь. Т.е например вы ищете информацию о функции substr на сервере файл с информацией о данной функции имеет путь /manual/function.sunstr.html чтобы обратиться к нему используем адрес /php-manual/?function.substr. Ну вот так вот все достаточно просто. Но вот все линки в html файлах старые (/manual/function.sunstr.html) а мне надо было чтобы они соответствовали моей системе. Что ж…вариантов два. Преобразовывать на лету регуляркой (apache или php не важно) или преобразовать один раз. Я решил что ресурсы сервера не бесконечны (преобразование на лету всегда неслабо грузило проц). Значит надо преобразовать единожды… Тут мне помогут регулярные выражения. Надо сказать, что знаю я их весьма поверхностно. Ну что ж…как говорится: «Иду на вы!».
И я начал свои изыскания. Могу сразу сказать, что промучался я пол дня, прежде чем получил нормальный результат, ну ничего тяжело в ученье-легко в бою. Потом будет проще. Вот что у меня получилось:


<?php

$arr_files 
glob('./manual/*.html');

$i 0;

foreach (
$arr_files as $filename)

{

    
$file_data file_get_contents($filename);

    
$file_data preg_replace('!<a(.*?)href="([^"]*)\.html((\#([^"]*))*?)"!is',

    
'<a\1href="?\2\3"',$file_data);

    if(
file_put_contents($filename,$file_data))

    
$i++;

}

print 
'Изменено '.$i.' сстраниц';

?>

Итак что же здесь написано? Первый пункт чтение дирректории с файлами. В этом нам помогает функция glob. Она получает все имена файлов по маске. В данном случе все файлы с расширением .html. Результат работы данной функции-массив данных с именами файлов. Теперь в цикле перебираем данный массив. В этом нам помогает foreach. Читаем файл в переменную-строку(file_get_contents). А вот теперь начинается самое интересное. Обработка ссылки и замена. Функция preg_replace-специальная функция регулярок, она производит поиск по тексту и замену соответствующего шаблону (регулярке) выражения на то что мы хотим.
Во первых надо помнить что любое регулярное выражение обрамляется либо парными символами (скобками например такими[]), либо одинаковыми символами, например как у меня !…!.
Вне данных символов(а точнее после) ставятся модификаторы. В моем случае модификаторы is. Модификатор i означает, что поиск ведется без учета регистра символов..а s здесь для того чтобы точка(которая обычно означает любой символ кроме перевода строки) означала и перевод строки. Таким образом мы пишем часть выражения (<a(.*?)) означающую что после тэга a может стоять любое количество любых символов. Звездочка означает повторение предыдущего символа 0 или более раз, а знак вопроса умеряет ее жадность). После чего пишем href="([^"]*)\.html((\#([^"]*))*?)"
([^"]*) означает что возможны любые символы, но не кавычки. Т.е знак ^ в квадратных скобках можно перевести как «не». Далее идет расширение файла в линке (\.html). Так как точка это спец символ ее надо экранировать обратным слэшем (так же как и далее экранируется решетка). Далее пользуемся тем же приемом что и ранее (([^"]*)) и указываем что выражение с решеткой может повторяться 0 или более раз. Это все конечно весьма сложно для понимания с нуля поэтому советую заглянуть на сайт pcre.ru дабы было понятнее. Внутри регулярки все что в круглых скобках мы получаем при поиске записывается в некий массив. Данные из которого мы можем вытянуть посредством \1\2\3 как это описано в строке замены (<a\1href="?\2\3").
Ну надеюсь в общем и целом вы разобрались что к чему и уловили основную суть. Собственно после этого просто запускаем скрипт и проверяем, что мы получили. Все линки должны переконвертироваться так, как нам надо. На этом я пожалуй закончу данную статью, дабы не перегружать читателя информацией и не валить все в одну кучу. Но прикручивание мануала на этом далеко не закончено и в скором времени (я надеюсь) выйдет продолжение. Надеюсь что данная информация была вам интересна и полезна.

Cookie что это такое и с чем их лучше есть)

Ну есть их лучше конечно с чаем) Cookie с английского переводится как печенье. Фактически это те данные которые мы можем сохранить на машине пользователя в браузере именно для нашего сайта. Проще всего посмотреть список кукисов для определенного сайта в опере. В моей 10 надо нажать инструменты->настройки->выбрать вкладку Дополнительно->cookie->управление Cookie. Ну вот теперь вы повелитель печенекь на своем компьютере:) Зачем они нужны? Ну например это удобно для примитивной идентификации пользователя (Гораздо безопаснее важные данные хранить в сессиях а не куках, но об этом я напишу позднее). Ну хватит «воды» пора переходить к конкретике. Итак мы разобрались что cookie хранятся у пользователя в браузере, но как же с помощью php их туда засунуть? Есть такая функция setcookie именно она задает их. Надо помнить, что cookie должна быть заданы до того как будут отправлены какие либо данные пользователю(т.е до какого-либо вывода на дисплей юзера). Я приведу простой пример как задаются кукисы, сделаю счетчик количества просмотров страницы, для каждого отдельного пользователя.


<?php

if(!$_COOKIE['count']) setcookie('count',1); 

//Если в глобальном массиве кук нет такого элемента, то создаем его

else $_COOKIE['count']++;

//иначе просто к существующему значению плюсуем 1

echo 'Вы просмотрели данную страницу ',($_COOKIE['count']?$_COOKIE['count']:1),' раз';

?>

Вот собственно и вся премудрость. В массиве COOKIE будет доступен данный элемент после следующей перезагрузки страницы. Надо заметить, что данная кука будет «жить» пока пользователь не закроет браузер, после чего она просто исчезнет, но бывают случаи когда надо задать cookie на гораздо дольший срок. Как раз для этого у setcookie имеется третий параметр, а именно время жизни кукиса. Задается он примерно вот так:


<?php

setcookie
('count',1,time()+3600); 

//Ставим значение для элемента массива $_COOKIE['count']

//равным единице и задаем время жизни куки один час

?>

Но и даже это еще не все. Иногда нужно задать куку для определенной дирректории. или для какого то из субдоменов вашего сайта. Тогда делаем вот так:


<?php

setcookie 
("count"1,time()+3600"/2009/"".phpbegun.ru"1);

?>

Для дирректории 2009 начиная от корня сайта я устанавливаю куку для всех субдоменов и домена сайта phpbegun.ru . Последний параметр равный единице обозначает то, что cookie защищенная, т.е будет отдаваться лишь в том случае, если используется HTTPS соединение.
И конечно же, чтобы обнулить нашу куку, если она вдруг перестала быть нужной надо просто выполнить setcookie без второго параметра.


<?php

setcookie
("count");

?>

После следующей загрузки страницы $_COOKIE['count'] будет удален.
Ну вот, теперь вы знаете что такое кукисы и с чем их лучше есть)

Работа с массивами

Собственно что такое массив? Для новичка проще всего представить массив таблицей, в одном столбце которой ключи, а в другом значение. Зная ключ мы можем получить значение. Ну или наоборот, если очень надо) Но давайте не будем спешить. Итак таблица:

Ключ Значение
yellow банан
green яблоко
red Томат

Так, я думаю, понятнее. Этот массив ассоциативный, т.е. ключами являются не цифры, а слова, в данном случае цвета на английском. Так же хочу заметить что настоятельно не рекомендуется ключами массива делать русские символы, т.е. слова содержащие их, ибо в дальнейшем при работе сценария может вылезти какая-нибудь непонятная фигня)
Ну, это запись простая понятная для нас с вами, а как же это записать в php? Есть несколько вариантов:


<?php

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

//или

$array['yellow'] = 'банан';

$array['green'] = 'яблоко';

$array['red'] = 'томат';

?>

Оба варианта написания являются абсолютно правильными. Но, согласитесь, первый покороче. :)

Итак, что такое массивы мы разобрались, теперь надо понять как же с ними работать. Прежде всего надо помнить что такие команды как echo или print выводят только строки и при попытке посмотреть «в массив» они нам выведут просто слово array. Что ж, значит надо использовать какие-то другие операторы. Для данных целей нам подойдут print_r и var_dump.
Оба оператора выводят список ключей и значений массива, но var_dump дает более полную информацию, такую как тип данных в массиве и, например если это строка, её длину. Попробуйте сделать вот так:


<?php

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

echo 
'<pre>';

print_r($array);

echo 
'<br/>';

var_dump($array);

echo 
'</pre>';

?>

Данные сведения вам очень помогут при отладке скрипта.

Ну, отладка это конечно хорошо,-скажете вы,-но ведь надо еще сначала и сам сценарий написать.
Полностью с вами согласен, пожалуй «русской кувалдой» для массивов является цикл foreach. О целесообразности его применения на данном этапе говорить не буду, ибо часто при помощи каких либо других операторов можно получить тот же результат гораздо быстрее (быстрее в плане выполнения самого скрипта).

Часто требуется отсортировать массив под свои требования, для этого хорошо помогает функция *sort, точнее это даже не одна, а целое семейство функций:
rsort — Сортирует массив в обратном порядке
sort — Сортирует массив в порядке позрастания элементов
ksort — Сортирует массив по ключам
krsort — Сортирует массив по ключам в обратном порядке
arsort — Сортирует массив в обратном порядке, сохраняя ключи
asort — Сортирует массив, сохраняя ключи
uasort — Сортирует массив, используя пользовательскую функцию для сравнения элементов с сохранением ключей
uksort — Сортирует массив по ключам, используя пользовательскую функцию для сравнения ключей
usort — Сортирует массив по значениям используя пользовательскую функцию для сравнения элементов.

Приведу примеры работы с несколькими из этих функций:


<?php

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

ksort($array);

print_r($array);

/*

Вернет

Array

(

    [green] => яблоко

    [red] => томат

    [yellow] => банан

)

*/

?>

Массив отсортирован по ключам. Теперь посмотрим вот это


<?

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

rsort($array);

print_r($array);

/*

Вернет

Array

(

    [0] => томат

    [1] => яблоко

    [2] => банан

)

т.е массив отсортирован в обратном порядке по отношению к тому как он был и ключи массива потеряны.

*/

?>

Как видите здесь все весьма просто. Если вам что то не понятно рекомендую обратиться к оффициальному мануалу, там все это весьма подробно описано, здесь же я лишь кратко привел список того что вам может понадобится.
Кроме того очень часто требуется определить существует ли какой то элемент в массиве. Ну на самом деле не перебирать же из-за этого весь массив. В таких случаях следует использовать функцию in_array:


<?php

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

if(
in_array('томат',$array))

echo 
'Такой элемент присутствует в массиве!';

?>

Так же в своей практике часто встречалсяс тем что надо проверить существует ли ключ в массиве. Это делается при помощи array_key_exists:


<?php

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

if(
array_key_exists('red',$array))

echo 
'Такой элемент присутствует в массиве!';

else echo 
'Такого элемента нет';

?>

Так же часто бывает нужно слить два массива в таких случаях надо использовать array_merge


<?php

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

$array2 = array('new','array');

$array3 array_merge($array,$array2);

print_r($array3);

/*

Вернет 

Array

(

    [yellow] => банан

    [green] => яблоко

    [red] => томат

    [0] => new

    [1] => array

)

*/

?>

Так же нужно бывает подсчитать количество элементов массива, для этого подойдет функция count


<?php

$array 
= array(

'yellow'=>'банан',

'green'=>'яблоко',

'red'=>'томат');

print 
count($array); //вернет 3

?>

Ну вот собственно и все что я хотел описать, данными функциями при работе с массивами я пользуюсь наиболее часто. Как всегда хочу попросить чтобы вы не забывали читать мануал, на время обучение это должно стать для вас библией. Так же буду рад любой критике или вопросам:)

Тайные данные или массив $_SERVER

Огромное количество нужных и важных данных содержит именно этот массив, данных как о клиенте так и о самом сервере на котором выполняется ваш PHP скрипт. Распишу подробно данные которые можно получить из этого массива:

$_SERVER['PHP_SELF']
Данный элемент массива содержит путь к файлу относительно корня сайта, т.е. если адрес до выполняемого скрипта: http://phpbegun.ru/files/script.php данный элемент массива будет содержать в себе /files/script.php.

$_SERVER['DOCUMENT_ROOT']
Содержит абсолютный путь до корневой дирректории сайта, т.е. путь от корня сервера.

$_SERVER['HTTP_HOST']
Содержит имя хоста из текущего запроса сервера.(т.е фактически хост сервера, елси он есть)

$_SERVER['SERVER_ADDR'] Возвращает IP сервера, на котором выполняется скрипт.

;$_SERVER['SERVER_NAME']
Имя (хост) сервера на котором запущен скрипт.

$_SERVER['REQUEST_METHOD']
Тип запроса использованный при оьбращении к скрипту. (например ‘GET’, ‘HEAD’, ‘POST’, ‘PUT’)

$_SERVER['QUERY_STRING']
Строка запроса, т.е. все что находится после вопросительного знака. (http://phpbegun.ru?what=1

$_SERVER[''HTTP_REFERER']
Данный элемент массива, если он существует, показывает нам на какой прошлый адрес, (до обращения к выполняемому скрипту) последний раз обращлся пользователь.

$_SERVER['HTTP_USER_AGENT']
С помощью данного элемента массива можно получить всю информацию о браузере (юзер агенте) пользователя.

$_SERVER['REMOTE_ADDR']
Здесь хранится IP пользователя который обратился к странице.

Я привел далеко не полный список ключей для этого массива, этими ключами я лишь пользуюсь наиболее часто. Для тех же кто хочет узнать все остальное есть мануал)

Защищаемся с помощью htaccess или конфигурация Apache

Очень часто все попытки написать грамотный, хорошо защищенный скрипт сводятся на нет лишь тем что сервер, на котором крутится ресурс неправильно настроен. Или точнее некоторые просто игнорируют настройку сервера как вариант защиты, а это, на мой взгляд абсолютно не приемлимо. «Как же защитить свой ресурс?»-спросите вы,-»Ведь на сервере обыкновенного хостера, нет доступа к доустановке какого либо ПО, или к консоли.» (в наше время консоль, к сожалению многих, предоставляют лишь на достаточно дорогих тарифах хостинга). Да, вы правы, если у вас нет консоли доустановить что-либо невозможно. Но вот сконфигурировать apache (web-сервер на котором крутятся очень многие хостинги) вполне в ваших силах с помощью волшебного файлика .htaccess Данный файл конфигурирует apache у вас на хостинге персонально для вас. Конечно, все настройки apache вы изменить не сможете, но в большинстве случаев это и абсолютно не нужно. Надо заметить что htaccess действует не только на ту дирректорию, в которой находится, но и на все каталоги ниже по древу, если конечно в них не лежит свой htaccess. Вот примерно так.
/.htaccess
/cat/.htaccess
/dir/
/dir/vigvam/

Здесь на каталоги dir распространяется действие «корневого» файла htaccess а в каталоге cat он свой.
Ну что ж…куда класть файл мы примерно разобрались, давайте теперь посмотрим что в нем должно быть. Прежде всего в корневом файле htaccess мы можем назначить страницы ошибок, чтобы выводились наши страницы, а не дефолтные «апачевские».
ErrorDocument 404 http://badcode.net.ru/404/
В примере при ошибке 404 (Not found) будет перекидывать на адрес http://badcode.net.ru/404/
Кроме того в данном файле можно задать по умолчанию индексную страницу, т.е. ту страницу которая будет выводиться если не найдена например index.html или index.php
DirectoryIndex figvam.php
Данный файл будет выводиться при запросе к корневой дирректории файла по умолчанию. Так же своими htaccess можно переназначить индексные файлы для других дирректорий.
Ну и конечно, обязательно, на мой взгляд должен быть запрет выдачи листинга директории всегда.
Options -Indexes
В некоторых дирректориях отдельно взятых CMS хранятся исключительно системные файлы, файлы библиотек или, если движок написан на файликах, возможно, какие-либо важные данные. Чтобы запретить доступ к данной дирректории с сайта в htaccess данной дирректории нужно добавить вот такую строку.
Order Deny,Allow

Deny from all
Первая строка предопределяет состояние по умолчанию и может принимать значения либо Deny, Allow либо Allow, Deny а вторая строка полностью запрещает доступ всем к этому каталогу. Но иногда требуется открыть доступ, для определенных ip (если у вас дома статический айпи в админку сайта вы сможете попадать только с него если настроите данную функцию, это очень неплохо защищает например от брутфорсинга). Тогда следует сдалать примерно так:
Order Deny,Allow

Deny from all

Allow from ip1,ip2
Где, ip1 и ip2 это айпишники с которых дозволен доступ. Но это далеко не весь спектр возможных настроек при помощи htaccess. Данный файл может конфигурировать php (если конечно php настроен на сервере как модуль apache, на большинстве хостингов это именно так). Например включить/отключить глобальные переменные.
php_flag register_globals off #отключили
Так же возможно включить или отключить magic_quotes
php_value magic_quotes_gpc off #отключили
У хорошего программиста пользователь никогда не видит ошибок в скриптах. А сделать это можно например так:
php_value error_reporting 0 # или
php_flag error_reporting 0

Но самой, на мой взгляд удобной особенностью является автоматическое добавление отдельного скрипта ко всем выполняемым:
php_value auto_prepend_file /home/www/user/htdocs/top.php
Т.е при запросе например к индексному php файлу будет сначала выполняться top.php. Адрес здесь должен быть от корня сервера.

Как видите вариантов настройки в данном файле очень много, и то что я здесь описал далеко не все. Я показал вам лишь пример что должно быть в файле конфигураций, чтобы вероятность того что вас взломают стремилась к нулю. Но это естественно не панацея. Это лишь еще одно средство защиты. Одно из многих. На оффициальном сайте apache адрес которого представлен здесь на сайте в разделе ссылок вы можете более подробно ознакомиться с настройками htaccess