(MQAtomic): работа над защитой от переполнения

9d40f0a5 · Pavel Vainerman · 17aad13a · 9d40f0a5 · 9d40f0a5 · 9d40f0a5
Commit 9d40f0a5 authored Jul 08, 2016 by Pavel Vainerman
Hide whitespace changes
Inline Side-by-side

Showing with 138 additions and 70 deletions

MQAtomic.h include/MQAtomic.h +4 -19

MQMutex.h include/MQMutex.h +1 -1

MQAtomic.cc src/Various/MQAtomic.cc +34 -35

test_mqueue.cc tests/test_mqueue.cc +99 -15

No files found.
--- a/include/MQAtomic.h
+++ b/include/MQAtomic.h
@@ -37,7 +37,7 @@ typedef std::shared_ptr<UniSetTypes::VoidMessage> VoidMessagePtr;
 * Т.к. подразумевает схему "МНОГО ПИСАТЕЛЕЙ" и "ОДИН ЧИТАТЕЛЬ".
 *
 * При этом место под очередь(буффер) резервируется сразу.
- * Счётчики сделаны (uint) монотонно растущими.
+ * Счётчики сделаны (ulong) монотонно растущими.
 * Основные идеи:
 * - счётчики постоянно увеличиваются
 * - каждый пишущий поток пишет в новое место (индекс больше последнего)
@@ -51,26 +51,11 @@ typedef std::shared_ptr<UniSetTypes::VoidMessage> VoidMessagePtr;
 * При помощи функции setLostStrategy() можно установить стратегию что терять
 * lostNewData - в случае переполнения теряются новые данные (т.е. не будут помещаться в очередь)
 * lostOldData - в случае переполнения очереди, старые данные затираются новыми.
- *
+ * Под переполнением подразумевается, что чтение отстаёт от писателей больше чем на размер буфера.
- * Защита от переполнения индекса (wpos и rpos).
- * =============================================
- * Т.к. для обеспечения lockfree записи индексы (wpos) постоянно растут
- * (т.е. каждый пишущий поток пишет в новое место), в качестве atomic индекса выбран unsigned long.
- * Для x86_32 системы работающей без перезагруки длительное время, переполнение индекса может стать проблеммой.
- * Фактически же размер циклического буфера ограничен и запись ведётся в позицию [wpos%size], т.е.
- * в общем случае достаточно чтобы индекс был не больше размера буфера (size).
- * \error ПОКА ПРОБЛЕММА ПЕРЕПОЛНЕНИЯ БЕЗ ПОТЕРИ ПАКЕТОВ НЕ РЕШЕНА..
- * чтобы "сбрасывать" индекс без потери сообщений, нужно одной транзакцией менять wpos, qpos и rpos.
- * Как это "красиво" сделать в рамках lockfree я пока не придумал.
- * Поэтому сейчас просто теряются сообщения, в зависимости от стратегии (lostStrategy) либо
- * не добавляются новые сообщения пока rpos не перейдёт через максимум (lostStrategy=lostNewData),
- * либо потеряются "старые" (rpos приравняется к wpos) - это  lostStrategy=lostOldData.
 *
 * --------------------------------
- * ЭТА ОЧЕРЕДЬ ПОКАЗЫВАЕТ В ДВА-ТРИ РАЗА ЛУЧШУЮ СКОРОСТЬ ПО СРАВНЕНИЮ С MQMutex
+ * ЭТА ОЧЕРЕДЬ ПОКАЗЫВАЕТ В ТРИ РАЗА ЛУЧШУЮ СКОРОСТЬ ПО СРАВНЕНИЮ С MQMutex
- * При скорости поступления сообщений 1 сообщение в 10 мсек, без переполнения на x86_32 очередь
+ * --------------------------------
- * проработает ~1.2 года (речь о работе без перезапуска программы)
- *
 */
 class MQAtomic
 {

--- a/include/MQMutex.h
+++ b/include/MQMutex.h
@@ -26,7 +26,7 @@
 typedef std::shared_ptr<UniSetTypes::VoidMessage> VoidMessagePtr;
 //--------------------------------------------------------------------------
 /*! \class MQMutex
- * Очередь сообщений на std::mutex-е.
+ * Простая "многопоточная" очередь сообщений с использованием std::mutex.
 * Максимальное ограничение на размер очереди сообщений задаётся функцией setMaxSizeOfMessageQueue().
 *
 * Контроль переполения очереди осуществляется в push

--- a/src/Various/MQAtomic.cc
+++ b/src/Various/MQAtomic.cc
@@ -39,13 +39,19 @@ void MQAtomic::push( const VoidMessagePtr& vm )
 	}
 	// -----------------------------------------------
-	// Если у нас wpos уже перешёл через максимум и стратегия "потеря новых сообщений"
+	// Если у нас wpos уже перешёл через максимум
-	// то просто ждм пока "подтянется" rpos
+	// то смотрим где rpos
 	if( wpos < rpos )
 	{
-		stCountOfLostMessages++;
+		// только надо привести к одному масштабу
-		if( lostStrategy == lostNewData )
+		unsigned long w = wpos%SizeOfMessageQueue;
+		unsigned long r = rpos%SizeOfMessageQueue;
+		if( lostStrategy == lostNewData && (r-w) >= SizeOfMessageQueue )
+		{
+			stCountOfLostMessages++;
 			return;
+		}
 	}
 	// -----------------------------------------------
@@ -72,45 +78,38 @@ VoidMessagePtr MQAtomic::top()
 		rpos.store( wpos - SizeOfMessageQueue );
 	}
-	if( rpos > qpos )
+	if( rpos == qpos )
-	{
+		return nullptr;
-		if( lostStrategy == lostNewData )
-		{
-			// дочитываем до конца.. (пока rpos не перейдёт через максимум)
-			unsigned long r = rpos.fetch_add(1);
-			return mqueue[r%SizeOfMessageQueue];
-		}
-		// if( lostStrategy == lostOldData )
+	// смотрим именно qpos, а не wpos.
-		rpos = 0;
+	// Т.к. qpos увеличивается только после помещения элемента в очередь
-		if( qpos == 0 )
+	// (помещение в вектор тоже занимает время)
-			return nullptr;
+	// иначе может случиться что wpos уже увеличился, но элемент ещё не поместили в очередь
-	}
+	// а мы уже пытаемся читать.
-	// смотрим qpos - который увеличивается только после помещения элемента в очередь
-	// т.к. помещение в вектор тоже занимает время,
-	// то может случиться что wpos уже увеличился, а элемент ещё не поместили в очередь
-	// при этом вызвался этот top()
 	if( rpos < qpos )
 	{
-		// сперва надо сдвинуть счётчик (чтобы следующий поток уже читал новое)
+		// сперва надо сдвинуть счётчик (чтобы следующий поток уже работал с следующим значением)
 		unsigned long r = rpos.fetch_add(1);
+		return mqueue[r%SizeOfMessageQueue];
+	}
-		// если в этот момент был "переполнен" wpos
+	// Если rpos > qpos, значит qpos уже перешёл через максимум
-		if( r > wpos && lostStrategy == lostOldData )
+	// И это особый случай обработки (пока rpos тоже не "перескочит" через максимум)
-		{
+	if( rpos > qpos ) // делаем if каждый раз, т.к. qpos может уже поменяться в параллельном потоке
-			r = 0;
+	{
-			if( rpos > wpos )
+		// приводим к одному масштабу
-				rpos = 0;
+		unsigned long w = qpos%SizeOfMessageQueue;
+		unsigned long r = rpos%SizeOfMessageQueue;
-			if( qpos == 0 )
+		if( lostStrategy == lostOldData && (r - w) >= SizeOfMessageQueue )
-				return nullptr;
+		{
+			stCountOfLostMessages++;
+			rpos.store(qpos - SizeOfMessageQueue); // "подтягиваем" rpos к qpos
 		}
-		// т.к. между if и этим местом, может придти другой читающий поток, то
+		// продолжаем читать как обычно
-		// проверяем здесь ещё раз
+		r = rpos.fetch_add(1);
-		if( r < qpos )
+		return mqueue[r%SizeOfMessageQueue];
-			return mqueue[r%SizeOfMessageQueue];
 	}
 	return nullptr;

--- a/tests/test_mqueue.cc
+++ b/tests/test_mqueue.cc
@@ -8,9 +8,14 @@
 // --------------------------------------------------------------------------
 // ВНИМАНИЕ! ЗДЕСЬ ОПРЕДЕЛЯЕТСЯ ТИП ТЕСТИРУЕМОЙ ОЧЕРЕДИ
 // (пока не придумал как параметризовать тест)
-typedef MQAtomic UMessageQueue;
 #define TEST_MQ_ATOMIC 1
+#ifdef TEST_MQ_ATOMIC
+	typedef MQAtomic UMessageQueue;
+#else
+	typedef MQMutex UMessageQueue;
+#endif
 // --------------------------------------------------------------------------
 #ifdef TEST_MQ_ATOMIC
 // специальный "декоратор" чтобы можно было тестировать переполнение индексов
@@ -209,26 +214,67 @@ TEST_CASE( "UMessageQueue: overflow index (strategy=lostOldData)", "[mqueue]" )
 	mq.set_wpos(max);
 	mq.set_rpos(max);
-	// это сообщение будет потеряно,
+	// При переходе через максимум ничего не должны потерять
-	// т.к. добавляется при ещё не переполненном wpos
 	pushMessage(mq,100);
+	pushMessage(mq,110);
+	pushMessage(mq,120);
-	// первое чтение после переполнения
-	// обновляет rpos, поэтому элемент последний мы теряем
 	auto m = mq.top();
-	REQUIRE( m == nullptr );
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 100 );
-	// это сообщение уже должно к нам вернутся
-	pushMessage(mq,110);
 	m = mq.top();
 	REQUIRE( m != nullptr );
 	REQUIRE( m->consumer == 110 );
+	m = mq.top();
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 120 );
+}
+// --------------------------------------------------------------------------
+TEST_CASE( "UMessageQueue: lost data (strategy=lostOldData)", "[mqueue]" )
+{
+	REQUIRE( uniset_conf() != nullptr );
+	unsigned long max = std::numeric_limits<unsigned long>::max();
+	MQAtomicTest mq;
+	mq.setLostStrategy(MQAtomic::lostOldData);
+	mq.setMaxSizeOfMessageQueue(2);
+	pushMessage(mq,100);
+	pushMessage(mq,110);
 	pushMessage(mq,120);
+	auto m = mq.top();
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 110 );
 	m = mq.top();
 	REQUIRE( m != nullptr );
 	REQUIRE( m->consumer == 120 );
+	m = mq.top();
+	REQUIRE( m == nullptr );
+	// Теперь проверяем + переполнение счётчика
+	mq.set_wpos(max);
+	mq.set_rpos(max);
+	// При переходе через максимум ничего не должны потерять
+	pushMessage(mq,140);
+	pushMessage(mq,150);
+	pushMessage(mq,160);
+	m = mq.top();
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 150 );
+	m = mq.top();
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 160 );
+	m = mq.top();
+	REQUIRE( m == nullptr );
 }
 // --------------------------------------------------------------------------
 TEST_CASE( "UMessageQueue: overflow index (strategy=lostNewData)", "[mqueue]" )
@@ -242,31 +288,69 @@ TEST_CASE( "UMessageQueue: overflow index (strategy=lostNewData)", "[mqueue]" )
 	mq.set_wpos(max);
 	mq.set_rpos(max);
+	// При переходе через максимум ничего не должны потерять
 	pushMessage(mq,100);
 	pushMessage(mq,110);
 	pushMessage(mq,120);
-	// мы должны прочитать последнее сообщение из очереди
 	auto m = mq.top();
 	REQUIRE( m != nullptr );
 	REQUIRE( m->consumer == 100 );
-	// дальше сообщений нет пока-что (а те что были были потеряны)
 	m = mq.top();
-	REQUIRE( m == nullptr );
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 110 );
-	pushMessage(mq,130);
+	m = mq.top();
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 120 );
+}
+// --------------------------------------------------------------------------
+TEST_CASE( "UMessageQueue: lost data (strategy=lostNewData)", "[mqueue]" )
+{
+	REQUIRE( uniset_conf() != nullptr );
+	unsigned long max = std::numeric_limits<unsigned long>::max();
+	MQAtomicTest mq;
+	mq.setLostStrategy(MQAtomic::lostNewData);
+	mq.setMaxSizeOfMessageQueue(2);
+	pushMessage(mq,100);
+	pushMessage(mq,110);
+	pushMessage(mq,120);
+	auto m = mq.top();
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 100 );
 	m = mq.top();
 	REQUIRE( m != nullptr );
-	REQUIRE( m->consumer == 130 );
+	REQUIRE( m->consumer == 110 );
+	m = mq.top();
+	REQUIRE( m == nullptr );
+	// Теперь проверяем + переполнение счётчика
+	mq.set_wpos(max);
+	mq.set_rpos(max);
+	// При переходе через максимум ничего не должны потерять
 	pushMessage(mq,140);
+	pushMessage(mq,150);
+	pushMessage(mq,160);
 	m = mq.top();
 	REQUIRE( m != nullptr );
 	REQUIRE( m->consumer == 140 );
+	m = mq.top();
+	REQUIRE( m != nullptr );
+	REQUIRE( m->consumer == 150 );
+	m = mq.top();
+	REQUIRE( m == nullptr );
 }
+// --------------------------------------------------------------------------
 #endif
 // --------------------------------------------------------------------------
 #undef TEST_MQ_ATOMIC