One-off fix to address the issue where a scheduler shutdown immediately after a special task leaves the HQE in a strange state. Specifically, we saw this when a cleanup fails, and the scheduler shuts down before the associated repair starts. HQEs are now requeued after a failed cleanup/verify. TODO: reimplement scheduler to maintain less state in memory by not relying on storing an array of AgentTasks. Risk: medium (scheduler change) Visibility: medium (scheduler bug fix) Signed-off-by: James Ren <jamesren@google.com> git-svn-id: http://test.kernel.org/svn/autotest/trunk@3573 592f7852-d20e-0410-864c-8624ca9c26a4

commit: 58721a8b8d9562579f2e45fdd80db2f67d58a6ac [log] [tgz]
author: showard <showard@592f7852-d20e-0410-864c-8624ca9c26a4> Thu Aug 20 23:32:40 2009 +0000
committer: showard <showard@592f7852-d20e-0410-864c-8624ca9c26a4> Thu Aug 20 23:32:40 2009 +0000
tree: e2ba0b3685ab65a837283c5e0861bd440f61f1df
parent: 3739978b7e911e0259382d62ccd88a28fa260744 [diff] [blame]
diff --git a/scheduler/monitor_db_unittest.py b/scheduler/monitor_db_unittest.py
index 6e6236f..bbcf17c 100644
--- a/scheduler/monitor_db_unittest.py
+++ b/scheduler/monitor_db_unittest.py

@@ -1490,7 +1490,6 @@
         agent.dispatcher = self._dispatcher
 
         self.host.set_status.expect_call('Repairing')
-        self.queue_entry.requeue.expect_call()
         self.setup_run_monitor(1, task_tag)
         self.host.set_status.expect_call('Repair Failed')
         self.queue_entry.update_from_database.expect_call()
@@ -1525,6 +1524,16 @@
         self._test_repair_task_with_queue_entry_helper(False, '2-repair')
 
 
+    def _setup_prejob_task_failure(self, task_tag, use_queue_entry):
+        self.setup_run_monitor(1, task_tag)
+        if use_queue_entry:
+            if not self.queue_entry.meta_host:
+                self.queue_entry.set_execution_subdir.expect_call()
+                self.queue_entry.execution_path.expect_call().and_return('tag')
+                self._setup_move_logfile(include_destination=True)
+            self.queue_entry.requeue.expect_call()
+
+
     def setup_verify_expects(self, success, use_queue_entry, task_tag):
         if use_queue_entry:
             self.queue_entry.set_status.expect_call('Verifying')
@@ -1533,11 +1542,7 @@
             self.setup_run_monitor(0, task_tag)
             self.host.set_status.expect_call('Ready')
         else:
-            self.setup_run_monitor(1, task_tag)
-            if use_queue_entry and not self.queue_entry.meta_host:
-                self.queue_entry.set_execution_subdir.expect_call()
-                self.queue_entry.execution_path.expect_call().and_return('tag')
-                self._setup_move_logfile(include_destination=True)
+            self._setup_prejob_task_failure(task_tag, use_queue_entry)
 
 
     def _check_verify_failure_tasks(self, verify_task):
@@ -1809,11 +1814,7 @@
             self.host.set_status.expect_call('Ready')
             self.host.update_field.expect_call('dirty', 0)
         else:
-            self.setup_run_monitor(1, task_tag)
-            if use_queue_entry and not self.queue_entry.meta_host:
-                self.queue_entry.set_execution_subdir.expect_call()
-                self.queue_entry.execution_path.expect_call().and_return('tag')
-                self._setup_move_logfile(include_destination=True)
+            self._setup_prejob_task_failure(task_tag, use_queue_entry)
 
         if use_queue_entry:
             task = monitor_db.CleanupTask(queue_entry=self.queue_entry)
commit	58721a8b8d9562579f2e45fdd80db2f67d58a6ac	[log] [tgz]
author	showard <showard@592f7852-d20e-0410-864c-8624ca9c26a4>	Thu Aug 20 23:32:40 2009 +0000
committer	showard <showard@592f7852-d20e-0410-864c-8624ca9c26a4>	Thu Aug 20 23:32:40 2009 +0000
tree	e2ba0b3685ab65a837283c5e0861bd440f61f1df
parent	3739978b7e911e0259382d62ccd88a28fa260744 [diff] [blame]